ChatGPT Agent发布：端到端训练开启多工具任务新时代

OpenAI推出 chatgpt Agent，革新AI多工具任务处理能力

北京时间2025年7月18日凌晨1点，OpenAI的Sam Altman和四位研究员直播发布了通用型AI Agent——ChatGPTAgent。这一发布虽有Manus等竞品在前，但ChatGPT Agent意义重大，其独特技术路径具有革命性。

ChatGPT Agent将Agent能力内化于模型，采用端到端训练方法，与OpenAIo3同属一个系列，是为代理任务开发的统一模型。其开发过程中，OpenAI将Operator和DeepReseARCh团队合并，通过强化学习完成训练，与Grok4 with tool路径相似。

该模型具有多方面特性。在功能上，它集成了多步研究、高质量报告生成、远程可视化浏览器任务执行、有限网络访问及外部数据源连接等能力，执行复杂任务后可交付PPT或文档。它配备可视化浏览器、文本浏览器、终端和APi访问四种工具，能根据任务需求自动选择。

ChatGPTAgent运行于特设的虚拟计算机环境，该环境沙盒化确保安全，能保存任务上下文，支持断点继续。其具备自主任务执行能力，可按用户自然语言指令完成系列操作；协作交互性强，会主动询问细节，用户可随时中断或接管；安全与权限控制严格，关键操作需用户授权，禁止高风险任务，内置恶意攻击防护。

在多项基准测试中，ChatGPT Agent表现优异。最难的HLE达到41.6%（with tool），高于Grok4（withtool）的41.0%；在Humanity’s LastExam上，单次作答准确率41.6%，并行八路推理后达44.4%；FrontierMath数学基准借助终端运行代码后准确率提升至27.4%；在现实数据科学任务DSBench、电子表格编辑能力及浏览器评测等方面均有出色表现。

使用方面，Pro用户自发布日起可立即使用，Plus与Team用户数日内开通，Enterprise与Education版本数周后接入。不同用户有不同消息额度，可按量计费追加。

奥特曼在发布会后提示使用风险，不法分子可能诱骗AI代理获取私人信息。为此，OpenAI沿用严格控制并新增防护，如关键动作需授权、高风险任务监督、拒绝高风险指令、清除浏览数据等。在生物与化学安全方面，按高风险级别处理，开展红队测试与威胁建模，启动漏洞赏金计划。

尽管ChatGPTAgent首次集成完整虚拟机环境，用户可实时观察操作过程，但各主流模型公司在“Agent即模型”道路上进展迅速。OpenAI在该领域仅迈出一小步，功能仍处早期，需持续迭代优化。

# AI快讯

文章版权归作者所有，未经允许请勿转载。