AI智能体OpenManus使用介绍

王亭_666

3188人浏览 · 2025-03-13 15:27:24

王亭_666 · 2025-03-13 15:27:24 发布

AI智能体OpenManus使用介绍

1. OpenManus概述

1.1 什么是Manus

Manus是由Monica团队开发的全球首款通用型AI智能体，于2025年3月6日正式发布。它能够独立思考、规划和执行复杂任务，直接交付完整成果。与传统AI不同，Manus不仅理解用户需求，还能自主规划任务流程，调用各种数字工具完成从分析、创作到交付的全过程。Manus在GAIA基准测试中表现优异，远超OpenAI的同层次大模型。Manus具有强大的工具调用能力，能调用浏览器、代码编辑器、数据分析工具等，实现任务的自动化执行。它还具备自主学习与优化能力，能根据用户反馈和任务结果不断学习和调整。Manus适用于多种场景，包括文件处理、数据分析、内容创作、旅行规划等。

1.2 什么是OpenManus

OpenManus是MetaGPT团队在3小时内复刻Manus核心功能的开源AI智能体项目。它采用模块化Agent系统，包含主代理、规划代理和工具调用代理等角色，可自由组合功能模块创建定制AI助手。OpenManus具有实时反馈机制，能可视化展示思考链、任务进度和文件生成过程。它配备强大的工具链，如浏览器自动化、Python代码执行器、网络搜索工具和文件处理系统，可处理复杂任务。OpenManus全免费且支持本地部署，无需邀请码，用户可外挂任意大模型API，灵活配置。它适用于多种场景，如文件处理、数据分析、内容创作等，为用户提供了一个灵活、高效的AI代理工具。

虽然Manus作为全球首款通用型AI智能体，功能强大，但存在一些局限性，如需要邀请码才能使用，这限制了其普及范围。用户对于无需邀请码、功能类似且开放的AI智能体有强烈需求，OpenManus正好满足了这一市场需求，为用户提供了一个免费、开源的替代方案。

1.3 OpenManus的技术架构与创新

模块化Agent系统
- 核心组件：
  - 主代理（项目经理）：协调任务分配与资源调度；
  - PlanningAgent（战略专家）：分解复杂任务为可执行步骤；
  - ToolCallAgent（技术专家）：调用工具链（如网络搜索、代码执行）。
- 多模型支持：无缝集成Claude 3.5、Qwen VL Plus等大模型，按需切换优势模型。
实时反馈机制
- 可视化LLM思维链，展示任务进度、思考日志和文件生成过程。
- 示例：用户输入“生成Manus分析报告”，OpenManus逐步输出搜索、整理、生成HTML的中间状态。
工具链协同设计
- 关键工具：
  - 浏览器自动化（模拟人类操作网页）；
  - Python代码执行器（实时生成与调试代码）；
  - 文件管理系统（自动生成文档并存储）。
- 协作逻辑：工具间通过标准化接口（如MCP协议）通信，提升任务执行效率。

2. 如何使用OpenManus

2.1 环境准备

pycharm开发环境
配置python3.12环境
环境具备网络访问(安装pip包，任务执行调用浏览器可访问各类网站)

OpenManus项目地址：https://github.com/mannaandpoem/OpenManus

git clone https://github.com/mannaandpoem/OpenManus.git

或下载 https://github.com/mannaandpoem/OpenManus/archive/refs/heads/main.zip 打开

2.2 配置步骤

通过pycharm开发工具配置python3.12环境，查看验证版本（我这里是通过pycharm配置了conda中python3.12环境）
在项目路径下执行pip install -r requirements.txt 安装项目依赖库，时间较久

如有报错，大多均为网络连接上的问题。可以考虑配置代理
将config目录下的config.example.toml配置文件，改名为config.toml

配置config.toml方式

我这里使用的是阿里千问

官方地址：https://bailian.console.aliyun.com/#/home

需要登录使用

确定model名，点击左边模型广场，各类模型可点击进入，上方标记处2即为模型model配置名
确定base_url，点击API示例，标记3处，在页面中即可找到当前model对应的base_url
api_key，点击右上角头像，api_key菜单中即可创建自己的api-key，然后复制到config文件中即可

【注意】: model有免费和收费2种，需要注意选择，我这里使用的qwen-max是付费model

2.3 运行OpenManus

运行python main.py

2.4 使用OpenManus

运行的效果与电脑显卡有关联

在Enter your prompt后面输入自己的需求

2.4.1 使用示例1

Enter your prompt: 对于低迷了5年的文化传媒板块，请分析文化传媒未来2年的发展趋势和曾经文化传媒知名股华谊兄弟300027，相对历史走势和未来发展，华谊兄弟是否是个相对好的买点。请把报告生成至一个文件

等待执行过程结束

此时openmanus会分成多个Executting step，一步步执行；这个过程较长，也是一个调试的过程，例如会提示工具调用了google_search网络不通等，需自行解决网络连接

示例：

 ERROR    | app.agent.toolcall:execute_tool:168 - ⚠️ Tool 'google_search' encountered a problem: HTTPSConnectionPool(host='www.google.com', port
=443): Max retries exceeded with url: /search?q=%E6%96%87%E5%8C%96%E4%BC%A0%E5%AA%92%E6%9D%BF%E5%9D%97+%E6%9C%AA%E6%9D%A5%E5%8F%91%E5%B1%95%E8%B6%8B%E5%8A%BF&num=12&hl=e
n&start=0&safe=active (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x00000211AA6BF320>: Failed to establish a new connection: [WinError 10051] 向一个无法连接的网络尝试了一个套接字操作。'))

在执行过程结束后翻看记录中如有提示缺少一些xxx库，可以执行完毕后，重新pip安装一下，重新尝试

示例：

 ✨ Manus's thoughts: 尝试使用Python的`yfinance`库来获取华谊兄弟的历史股价数据时，遇到了一个限制：当前环境中没有安装`yfinance`库。这阻碍了我们直接通过编程方式获取股票数据。
 
根据提示则 pip install yfinance

结果

从生成的结果数据看非常一般，一顿思考执行任务，最后并没有达到自己预期的效果，和平时使用的chat会话基本差不多，但是过程中的step任务拆解和思考过程，以及调用本地的浏览器工具等使用，还是眼前一亮。但遇到 OpenManus 在打开页面任务中途出现需要点击对话框的交互情况，则需要人为介入操作，不然此步骤会卡顿、超时。在缺少pip依赖库时，不会自动执行安装，影响本轮的任务执行。

2.4.2 使用示例2

再次运行python main.py

在Enter your prompt后面输入自己的需求

Enter your prompt: 魔兽世界正式服11.1的史诗难度团本已经开放，浏览统计各大网站，请给我一个最新的公会击杀进度排名并保存到文件

执行结果并不理想，等待许久最后提示图中的信息，建议手动访问提供的链接并把信息复制反馈，但操作过程中其实并没有给时间进行交互就已经执行完本轮的任务了，最后没有成功的生成文件。根据提示给的连接打开后，的确是任务中需要的关键信息，但连接中的信息是相关的图片，并不是文字类描述。所以任务中可以获取到图片中的信息，只是无法进行识别获取。