ChatGPT Agent发布:端到端训练开启多工具任务新时代

AI快讯8秒前发布 niko
1 0
AiPPT - 一键生成ppt

OpenAI推出chatgpt Agent,革新AI多工具任务处理能力

北京时间2025年7月18日凌晨1点,OpenAI的Sam Altman和四位研究员直播发布了通用型AI Agent——ChatGPTAgent。这一发布虽有Manus等竞品在前,但ChatGPT Agent意义重大,其独特技术路径具有革命性。

ChatGPT Agent将Agent能力内化于模型,采用端到端训练方法,与OpenAIo3同属一个系列,是为代理任务开发的统一模型。其开发过程中,OpenAI将Operator和DeepReseARCh团队合并,通过强化学习完成训练,与Grok4 with tool路径相似。

该模型具有多方面特性。在功能上,它集成了多步研究、高质量报告生成、远程可视化浏览器任务执行、有限网络访问及外部数据源连接等能力,执行复杂任务后可交付PPT或文档。它配备可视化浏览器、文本浏览器、终端和APi访问四种工具,能根据任务需求自动选择。

ChatGPTAgent运行于特设的虚拟计算机环境,该环境沙盒化确保安全,能保存任务上下文,支持断点继续。其具备自主任务执行能力,可按用户自然语言指令完成系列操作;协作交互性强,会主动询问细节,用户可随时中断或接管;安全与权限控制严格,关键操作需用户授权,禁止高风险任务,内置恶意攻击防护。

在多项基准测试中,ChatGPT Agent表现优异。最难的HLE达到41.6%(with tool),高于Grok4(withtool)的41.0%;在Humanity’s LastExam上,单次作答准确率41.6%,并行八路推理后达44.4%;FrontierMath数学基准借助终端运行代码后准确率提升至27.4%;在现实数据科学任务DSBench、电子表格编辑能力及浏览器评测等方面均有出色表现。

使用方面,Pro用户自发布日起可立即使用,Plus与Team用户数日内开通,Enterprise与Education版本数周后接入。不同用户有不同消息额度,可按量计费追加。

奥特曼在发布会后提示使用风险,不法分子可能诱骗AI代理获取私人信息。为此,OpenAI沿用严格控制并新增防护,如关键动作需授权、高风险任务监督、拒绝高风险指令、清除浏览数据等。在生物与化学安全方面,按高风险级别处理,开展红队测试与威胁建模,启动漏洞赏金计划。

尽管ChatGPTAgent首次集成完整虚拟机环境,用户可实时观察操作过程,但各主流模型公司在“Agent即模型”道路上进展迅速。OpenAI在该领域仅迈出一小步,功能仍处早期,需持续迭代优化。

© 版权声明
Trea - 国内首个原生AI IDE