2025年伊始,AI领域创新成果不断涌现,其中Manus、OpenAI CUA、AnthroPic MCP等尤为引人注目。
Manus:创新与不足并存
Manus的推出,在AI界引发关注。其核心架构基于“虚拟机 +多Agent协同”模式,整合多个底层大模型API,实现任务动态分配与模型调用。这一设计突破传统AI助手局限,达成从“需求输入”到“成果交付”的端到端闭环。
同时,Manus秉持“Less Structure, MoreIntelligence”交互理念,借助无代码化自然语言接口降低用户使用门槛。此外,通过外置markdown文件管理Agent任务规划,并存储阶段性工作成果,是一大创新亮点。
然而,Manus并非完美。它面临“幻觉累加”问题,多次大模型问答串联会降低准确率。并且,可供大模型调用的工具不足,输出内容形式受限,难以与人类工作流完美融合。此外,“小院高墙”的互联网生态也阻碍其获取优质信息,影响工作效果。
OpenAI CUA:可自主操作电脑的Agent
今年1月底,OpenAI发布由CUA(Computer-UsingAgent)驱动的AI智能体Operator。CUA模型融合GPT-4o视觉能力与强化学习高级推理能力,能将任务分解为多步骤计划,并自我调整纠正。
CUA运作原理清晰:同时接收文本指令和屏幕截图,处理后生成动作指令,电脑执行操作后反馈新截图与指令,循环直至获得答案。官方测评显示,CUA在操作电脑和浏览器方面性能提升显著,但与人类仍有差距。
Anthropic MCP:AI时代的TCP/IP协议
Anthropic推出的MCP(Model ContextProtocol),旨在解决Agent工具不足问题。它定义应用程序与AI模型交换上下文信息的方式,统一AI与工具层交互接口,实现动态发现和双向通信。
如今,越来越多工具及服务接入MCP,如GoogleMaps、PGSQL等。在Smithery平台可查找对应工具服务,未来AI可调用工具将呈指数级增长,有望突破Agent能力天花板。
2025年AI发展新趋势
2025年AI发展呈现新趋势。预训练逐渐落幕,后训练成为重点,DeepSeek R1论文已提及。强化学习将成主流,监督学习重要性降低,DeepSeekR1表明纯粹RL可能是通向AGI的正确路径。
MultiAgent是必然趋势,如同大脑各部分协同,多个模型相互协作,MCP则协调统一数据通信接口,助力处理复杂现实任务。
2025年作为AI Agent元年,Manus、OpenAI CUA、Anthropic MCP等创新成果为AI发展指明方向,未来AI发展值得期待。