OpenAI发布全新推理模型,引领技术革新
OpenAI在AI领域再次迈出重大步伐,联创Greg Brockman与首席研究官MarkChen带队直播,推出备受瞩目的满血版o3以及下一代推理模型o4-mini。这两款模型带来了前所未有的功能突破,标志着AI技术的新高度。
视觉推理新巅峰,实现「图像思考」
o3和o4-mini在视觉推理方面全面超越前代,成为o系列最新的视觉推理佼佼者。它们首次实现了在思维链(CoT)中用图像进行深度推理,不再仅仅是简单的图像识别,而是真正意义上的「用图像思考」。这种原生的能力无需依赖额外专业模型,在多个基准测试领域,如STEM问答、图表阅读与推理等,均创下了SOTA记录,在V*基准测试上更是以96.3%准确率实现重大飞跃。
智能工具运用,解决复杂任务
这两款模型的另一大亮点在于对工具的运用。它们与以往推理模型不同,被用于训练各种工具,并在解决难题时巧妙调用。例如,o3在面对复杂问题时,能连续数百次调用工具,生成的代码在实际代码库中发挥作用。无论是科研领域的难题求解,还是日常工作流中的任务处理,o3和o4-mini都能凭借工具调用展现强大实力。
开源编程智能体,拓展应用边界
OpenAI开源了可在终端运行的轻量级编程AI智能体CodexCLI,旨在充分发挥o3和o4-mini的推理能力。它可安全地在本地部署代码执行,通过与模型结合,能处理屏幕截图或草图,实现多模态推理功能。同时,OpenAI启动百万美元资助计划,推动相关项目发展,CodexCLI一经发布便获得高度关注。
强化学习显成效,性能持续提升
在研发过程中,OpenAI遵循Scaling路径强化学习。提升训练和推理计算量后,o3和o4-mini性能显著提升。相较于o1,o3在相同条件下性能更优,且思考时间延长时性能还能进一步提高。此外,通过强化学习,模型学会了智能使用工具,在复杂任务中表现更加游刃有余。