北京时间2月3日上午,OpenAI面向深度研究领域推出智能体产品深度研究功能。这一功能极大提升了专业研究效率,曾需行业分析师数天甚至数周完成的专业研究报告,现在借助它5到30分钟就能完成。
深度研究功能由即将推出的OpenAIo3模型特制版本支持,此版本针对网页浏览和数据分析场景优化。它能运用推理能力,在互联网上搜索、解读和分析海量文本、图像和PDF文件,并根据信息灵活调整研究方向。
在对该智能体能力评测的Humanity’s LastExam(简称HLE)测试中,深度研究使用的模型在专家级问题上准确率达到26.6%,刷新之前18.2%的纪录,而DeepSeek的R1模型准确率仅为9.4%。HLE测试由全球多领域专家共同开发,涵盖100多个学科领域超3000道题目,是衡量人工智能学术能力的前沿基准。
深度研究功能专为金融、科学等领域知识工作者设计,也适用于谨慎选购产品的消费者。其输出附有清晰引用和思考过程总结,擅长寻找冷门信息,能独立从网络发现、推理并整合见解。在ChatGPT中,用户选择“深度研究”选项输入问题即可使用,研究完成会收到通知,输出以报告形式呈现。
深度研究通过端到端强化学习,针对复杂网络浏览和推理任务训练。在技术架构上,由信息发现、信息综合、推理和输出四个核心模块协同工作,形成完整智能研究系统。
在众多公开评估中,深度研究表现出色。除HLE测试外,在GAIA基准测试中也达到最前沿水平并登上外部排行榜首位。不过,该功能目前处于早期阶段,存在生成虚假信息、难以区分权威与谣言等局限性。
目前,深度研究在ChatGPT中的使用对计算资源需求较高,OpenAI已推出针对Pro用户的优化版本,每月最多支持100次查询。未来,Plus和Team用户、企业用户也将获得访问权限,且功能将不断完善扩展。