深度剖析Manus:底层模型、灵感来源与发展前景

AI快讯3个月前发布 niko
44 0
AiPPT - 一键生成ppt

Manus底层模型选择背后的考量:Manus迅速走红后信息纷杂。其背后主要采用Claude(aPi)和后训练的阿里Qwen,而非DeepSeek。这是因为DeepSeek虽推理能力强,但在Functioncalling、多模态、长上下文方面表现欠佳,而这些特性对Manus这类自动化Agent产品至关重要。Functioncalling能实现多样任务,长上下文支持复杂任务,多模态让Agent具备更多能力,其中长上下文驱动的长链规划能力尤为关键。

给Manus灵感的Devin:Devin是ai编程领域的自动化Agent产品,具有异步、有云端虚拟机、能随时打断并积累知识等特征,Manus从中获得灵感。Devin产品定义超前,超越诸多同类产品理念。Monica团队借鉴其优势并将其落地,值得其他团队反思。

AI时代的“安迪比尔定律”与“杰文斯悖论”:Agent对token消耗呈指数增长,符合AI时代的“安迪比尔定律”,即LLM厂商降低token生成成本,Agent会增加token消耗量,且AI领域该定律速度更快。同时,Manus发展遵循“杰文斯悖论”,资源使用效率提高会增加总消耗。从长远看,国内Agent发展有成本优势。

大厂复制Manus的难度:很多人认为大厂能快速复制Manus,但实际难度较大。原因在于Monica团队复合经验丰富,对不同模型和浏览器产品熟悉,且关注海外进展;对产品需求理解深刻,产品有诸多实用巧思;团队敏捷性高,扁平团队利于快速迭代产品,大厂短时间难以组建此类团队。

Manus的融资可能性:尽管大厂入局不易,但一定会参与Agent领域竞争。Devin估值达20亿美金,而Monica团队大概率未达此级别,资金相对不足。为应对竞争,Manus可能会进行大规模融资,此次出圈也将提供有利融资环境。

如何评价Manus的表现:评价Manus表现可从三个维度。一是GAIA的Benchmark分数显示其在基准线以上;二是高分不代表个人实际使用体验好,实测中Manus表现有差异;三是要理解其边界,目前处于轻度缝合怪阶段,任务成功率受底层模型影响,且其价格因素也需纳入评估,最终表现有待市场检验。

© 版权声明
Trea - 国内首个原生AI IDE