OpenManus开源复刻,揭秘Manus实现路径与技术关键

AI快讯2个月前发布 niko
70 0
AiPPT - 一键生成ppt

近日,一款名为OpenManus的开源复刻版引发关注,它对标全球首款通用智能体Manus。令人惊叹的是,5人团队仅花费3小时,就打造出完全免费且无需排队的OpenManus。

通过深入探究OpenManus,可挖掘出一条实现Manus的合理路径。OpenManus背后存在三大关键因素。其一为拥有模块化Agent系统,在此系统下,开发者能够依据自身需求,自由组合不同功能模块,进而创建独特的AI助手。不同分工的Agent相互协作,完成需求理解、规划、行动等一系列任务。例如,Manus主代理如同项目经理,负责理解用户需求并进行分工;PlanningAgent作为规划员,将复杂任务拆解为可执行步骤;ToolCallAgent则作为技术专家,掌管各类工具使用。这一套机制借助开源团队曾提出的MetaGPT得以实现,开发者可自由集成多个合适的大语言模型。

其二,OpenManus具备实时反馈机制,其思维过程公开透明。就像开头所举例子,拿到任务后,OpenManus的思考方式、规划执行过程等都能实时反馈,这为人类在恰当时间进行干预提供契机,有助于更高质量地完成任务。

其三,OpenManus配备了一整套强大的工具链。为完成复杂任务,它拥有一系列“外援”,如浏览器自动化,可像人类一样操作浏览器,自动分析网络信息并交互;各种代码执行器,能够实时生成和执行代码;文件处理功能,可自动生成和管理各类文档等。值得注意的是,各类工具并非单独模块,而是协同设计。多智能体系统一般架构为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类APi接口完成具体操作。

OpenManus团队的开发速度惊人,仅1小时就完成核心系统,整体3小时全部完成。核心作者梁新兵表示,这得益于MetaGPT积累的技术沉淀,团队将浏览器工具链嫁接到过去代码上,并配合沉淀的Agent工具包。团队研发成员多来自MetaGPT团队,“开源版Devin”——数据解释器也出自该团队。

团队成员履历丰富。核心作者梁新兵毕业于华东师大,在校时就参与DataInterpreter工作。另一名核心作者向劲宇本科就读于西南交通大学应用物理系,曾获阿里巴巴数学竞赛AI赛道全球第二名,在MetaGPT社区也有诸多成果。张佳钇毕业于中国人民大学高瓴人工智能学院,现为港科大(广州)在读博士,与向劲宇是智能体框架AFlow的共同一作。于兆洋是张佳钇在人大的同级同学,洪思睿是MetaGPT和DataInterpreter两篇论文的共同一作,他们也都参与了AFlow项目。今年,张佳钇和向劲宇等五人共同参与SPO项目,该项目能让提示词自我进化。

此外,OpenManus的出现为Manus的“套壳风波”提供新视角。Manus被质疑“套壳”主要源于两点:一是其背后团队曾打造的Monica曾陷入套壳争议;二是产品被怀疑是套壳缝合而成,导致人们认为其技术含量不高。然而,从OpenManus复现路径看,许多模块基于已有开源项目实现,实现不同模块的统筹、调度并形成新功能并非易事。而且,开源社区的意义在于让开发者站在巨人肩膀上,模型厂商提供API也是为了让开发者开发新应用。所以,是否“套壳”并非关键,关键是产品能否产生实质性的生产力提升。但实际测试发现,Manus距离这一目标还有很大差距,因此打磨产品能力更为重要。

开源地址 :https://github.com/mannaandPoem/OpenManus

参考链接 :[1]https://x.com/didiforx/status/1897675038972883408[2]https://www.sohu.com/a/827134153_121798711[3]https://modelscope.cn/stUdios/AI-ModelScope/SPO

© 版权声明
Trea - 国内首个原生AI IDE