5 个人三小时复刻开源版 Manus,邀请码也不需要
这堵障碍...... 曾一夜走红的 Manus,如今已经有了开源复刻版!
5 名开发人员耗时 3 小时,就创建了一个完全免费、无需等待的 OpenManus。
至于再现程度,最好是直接与 Manus 官方和开源团队提供的演示进行对比。
作为首个通用智能体,官方提供的案例如下:
而 OpenManus 团队在三小时内所实现的复制成果,实在令人刮目相看:
对具有较强动手能力的用户,鼓励大家体验后分享反馈。
从开源逆向推演 Manus 的实现路径
通过深入研究 OpenManus,我们实际上可看到一条实现 Manus 的合理途径。
(目前 Manus 使用的模型、Agent 框架等细节仍保密)
总的来说,OpenManus 背后具备三大关键:
模块化的 Agent 系统;
实时反馈机制;
全套功能强大的工具链;
详细来看,核心设计在于这种模块化 Agent 系统。开发人员可基于需求自由地组合各种功能模块,从而打造独特的 AI 助手。
在 OpenManus 中,不同职能的 Agent 将共同完成需求理解、规划、执行等任务。
例如,Manus 主代理扮演项目经理的角色,负责理解用户需求并指导分工;PlanningAgent 充当规划员,将复杂任务进一步分解为可执行步骤;而 ToolCallAgent 则负责技术方面,主持各种工具的使用。
这整套结构均是建立在开源团队之前提出的 MetaGPT(一种多智能体框架)的基础上,开发者可以融合多个合适的大型语言模型。
此外,OpenManus 的另一个关键点在于其思维过程完全透明公开。
正如本文一开始提到的例子,OpenManus在接到任务后,如何处理问题、如何计划执行...... 全部均可实时反馈。
这让人类有机会在适当时刻进行干预,有助于更高效地完成任务。
最后不得不提及 Agent 对工具的应用。
为了应对复杂任务,OpenManus 配备了各种“外援”:
浏览器自动化:模拟人类操作浏览器,自动分析网络信息并与之交互;
各种代码执行器:实时生成和执行代码;
文件处理:自动生成和管理各类文件;
......
需要注意的是,这些工具并非独立模块,而是需要协同设计。
将这些要素整合在一起,这类多智能体系统的典型架构是:底层由各类大型语言模型构成,中间层基于多智能体合作实现任务分解,执行层通过调用各类 API 接口完成具体操作。
总的来说,正如 OpenManus 作者所总结的,这一开源成果结合了 computer-use、基本代理和融合规划能力。
此外,从昨天的测试感受来看,Manus 距离这一目标仍有一段距离。
因此,对产品能力进行完善,可能比争议是否“套壳”更为重要。
您对 Manus 有何感想?欢迎在评论区分享您的看法。
开源地址:
https://github.com/mannaandpoem/OpenManus
参考链接:
[1]https://x.com/didiforx/status/1897675038972883408
[2]https://www.sohu.com/a/827134153_121798711
[3]https://modelscope.cn/studios/AI-ModelScope/SPO
本文来源:量子位(ID:QbitAI),作者:克雷西、一水
广告声明:本文含有外部链接,仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。