OpenAI 推出全新模型 o3 与 o4-mini：视觉推理与工具使用的革命性突破

AI快讯1年前 (2025)发布 niko

OpenAI发布全新推理模型，引领技术革新

OpenAI在AI领域再次迈出重大步伐，联创Greg Brockman与首席研究官MarkChen带队直播，推出备受瞩目的满血版o3以及下一代推理模型o4-mini。这两款模型带来了前所未有的功能突破，标志着AI技术的新高度。

视觉推理新巅峰，实现「图像思考」

o3和o4-mini在视觉推理方面全面超越前代，成为o系列最新的视觉推理佼佼者。它们首次实现了在思维链（CoT）中用图像进行深度推理，不再仅仅是简单的图像识别，而是真正意义上的「用图像思考」。这种原生的能力无需依赖额外专业模型，在多个基准测试领域，如STEM问答、图表阅读与推理等，均创下了SOTA记录，在V*基准测试上更是以96.3%准确率实现重大飞跃。

智能工具运用，解决复杂任务

这两款模型的另一大亮点在于对工具的运用。它们与以往推理模型不同，被用于训练各种工具，并在解决难题时巧妙调用。例如，o3在面对复杂问题时，能连续数百次调用工具，生成的代码在实际代码库中发挥作用。无论是科研领域的难题求解，还是日常工作流中的任务处理，o3和o4-mini都能凭借工具调用展现强大实力。

开源编程智能体，拓展应用边界

OpenAI开源了可在终端运行的轻量级编程AI智能体CodexCLI，旨在充分发挥o3和o4-mini的推理能力。它可安全地在本地部署代码执行，通过与模型结合，能处理屏幕截图或草图，实现多模态推理功能。同时，OpenAI启动百万美元资助计划，推动相关项目发展，CodexCLI一经发布便获得高度关注。

强化学习显成效，性能持续提升

在研发过程中，OpenAI遵循Scaling路径强化学习。提升训练和推理计算量后，o3和o4-mini性能显著提升。相较于o1，o3在相同条件下性能更优，且思考时间延长时性能还能进一步提高。此外，通过强化学习，模型学会了智能使用工具，在复杂任务中表现更加游刃有余。

# AI快讯

文章版权归作者所有，未经允许请勿转载。

OpenAI 推 出 全 新 模 型 o3 与 o4-mini：视 觉 推 理 与 工 具 使 用 的 革 命 性 突 破

OpenAI 推出全新模型 o3 与 o4-mini：视觉推理与工具使用的革命性突破