2025年下半场伊始,一直引领AI发展的OpenAI公布了其Agent模式。此模式和数月前火爆的Manus模式极为相似,于7月18日凌晨,由SamAltman和四位研究员在直播中介绍。
OpenAI Agent模式功能强大。用户对chatgpt提出如购买婚礼鞋、设计宠物周边等需求后,它会开启虚拟机操作。演示中,复杂任务约10分钟完成,完成度颇高。它能调用文本浏览器、可视化浏览器和终端,基于终端还能调用云服务APi、图片生成器等。用户可在任务中植入新需求,实时交互。
模式由工具融合而来 。OpenAI Agent模式是Operator和DeepReseARCh的融合。Operator是原仅向Pro用户开放的浏览器Agent工具,能分析图形界面操作;DeepResearch是深入研究的分析工具,可生成调研报告。二者融合避开了仅用浏览器图形界面读文字材料的低效,缩短了形成深度报告的时长。
模型通过强化学习进步。OpenAI采用强化学习训练模型,让其尝试用所有工具解决简单问题,奖励高效合理行为,使其学会合适场景选用合适工具。在基准测试中,Agent模式在HumanitiesLast Exam取得42%的高分,高级数学推理能力也有提升。
Agent时代带来新挑战。Agent是2025年AI风口,但此前用户体验不佳。OpenAI此次融合或缓解问题。对于第三方开发者和用户,分别面临生态竞争和隐私安全挑战。OpenAI会采取安全措施,也希望社会建立规范。
© 版权声明
文章版权归作者所有,未经允许请勿转载。