OpenAI o3-mini思维链公开,与DeepSeek R1实测对比凸显差异

AI快讯2周前发布 niko
25 0
AiPPT - 一键生成ppt

今日凌晨,OpenAI宣布公开最新模型o3-mini系列模型的思维链。这一举措使得用户能够看到o3-mini以及o3-mini(high)的“思考”过程,从而更清晰地了解模型的推理及结论得出方式。

OpenAI研究科学家NoamBrown在X平台表示,在o1-Preview发布前,思维链(CoT)实时运行让大家意识到其重要性。此次公开的虽非原始思维链,但已十分接近。他很高兴能与世界分享这一体验。

然而,据外媒TechCrunch报道,OpenAI并未完全公开o3-mini的完整推理步骤,而是“找到一个平衡点”,让o3-mini先“自由思考”,再整理出更详细的推理摘要。此前,出于竞争考虑,OpenAI对o3-mini及其前身(o1和o1-mini)的推理步骤未完全公开,仅提供有时并不准确的推理摘要。

为提高清晰度和安全性,OpenAI引入额外后处理步骤。模型会先审查“思维链”,剔除潜在不安全内容,并适度简化复杂概念。这一步骤还支持非英语用户,确保他们能用母语查看“思维链”,提升体验友好度与易懂性。

实际上,推理透明度在AI领域正逐渐成为重要竞争点。展示完整推理步骤,既能提高用户信任度,又便于AI的研究与改进。但公开思维链可能被竞争对手利用,OpenAI首席产品官KevinWeil曾表示,是否展示完整“思维链”因竞争问题尚未确定,但会找到平衡点。

相比之下,DeekSeekR1的思维链无条件公开透明,其深度思考过程获不少网友点赞。此次OpenAI的“被迫”调整,显然是为应对DeepSeek及其他AI公司的压力。

X网友@thegenioo实测思维链更新后表示,新版本界面更流畅,模型思考过程更透明。以下是DeepSeek R1与OpenAIo3-mini(high)在同一问题上的思考对比。

在“deeepseeeeeek有多少个e”“假设有一个池塘……取得3升的水”“一个人花8块钱买鸡……赚了多少”等测试中,二者呈现出不同“思维风格”。DeepSeekR1更像文科生,推理过程循序渐进、思路周密细腻,结果可靠且逻辑偏差少;o3-mini(high)更像理科生,推理简洁明快、直指问题核心。

这种差异也体现在响应速度上,DeepSeek R1思考时间相对较长,o3-mini(high)更快。答案方面,DeepSeekR1的解答更完整详实,o3-mini(high)则较为“公事公办”。

由于o3-mini公布的并非完整版思维链,开放后引发不少质疑。OpenAI CEO SamAltman在X平台解释称,他们尝试整理原始思维链,使其更易读并按需翻译,尽量保持原始风格。不过,有网友指出,若没有DeepSeek,或许看不到o3-mini哪怕是“阉割版”的思维链。

© 版权声明
智谱清言 - 国产最强AI模型