OpenAI o3-mini系列思维链公开,与DeepSeek R1思考过程对比引关注

AI快讯2周前发布 niko
14 0
AiPPT - 一键生成ppt

今日凌晨,OpenAI有新动作,公开了最新模型o3-mini系列模型的思维链。这一举措,让用户得以一窥o3-mini以及o3-mini(high)的「思考」路径,更清晰知晓模型如何推理得出结论。

OpenAI研究科学家NoamBrown在X平台表示,在o1-Preview发布前介绍相关内容时,思维链实时运行让很多人意识到其重要性。此次公开的虽非原始思维链,但已十分接近,能与世界分享这一体验他感到高兴。

他还提到,o3-mini是首个能持续准确解答井字棋问题的大语言模型。尽管概括后的思维链看似有些混乱,但模型最终成功找到了正确答案。

然而,此次公开并非毫无保留。据外媒TechCrunch报道,OpenAI不会完全公开o3-mini的完整推理步骤,称已「找到一个平衡点」,让o3-mini先「自由思考」,再整理出更详细的推理摘要。此前,出于竞争考虑,OpenAI对o3-mini及其前身(o1和o1-mini)的推理步骤未完全公开,仅提供有时并不准确的推理摘要。

为提高清晰度与安全性,OpenAI引入额外后处理步骤。模型会先审查「思维链」,剔除潜在不安全内容,并适度简化复杂概念。这一步骤还支持非英语用户,确保他们能用母语查看「思维链」,让体验更友好易懂。

在AI领域,推理透明度正成为重要竞争点。展示完整推理步骤,既能提高用户信任度,也便于AI被研究改进。但公开思维链可能被竞争对手利用,OpenAI首席产品官KevinWeil曾表示,他们在努力展示更多推理过程,是否展示完整「思维链」因竞争问题尚未确定,但会找到平衡点。

相比之下,DeekSeekR1的思维链无条件公开透明,其深度思考过程获不少网友点赞。OpenAI此次「被迫」调整,或为应对DeepSeek及其他AI公司的压力。

X网友@thegenioo实测思维链更新后表示,新版本用户界面更流畅,模型思考过程更透明。

通过对比DeepSeek R1与OpenAIo3-mini(high)在同一问题上的思考过程,能发现二者不同「思维风格」。如面对多个测试问题,DeepSeekR1推理循序渐进、思路周密,结果可靠且逻辑偏差少,像“文科生”;o3-mini(high)推理简洁明快、直指核心,像“理科生”。

这种差异在响应速度上也有体现,DeepSeek R1思考时间相对较长,o3-mini(high)则更快。答案方面,DeepSeekR1解答更完整详实,o3-mini(high)相对简洁。

此次o3-mini公布的非完整版思维链,引发不少质疑。OpenAI CEO SamAltman在X平台解释,他们尝试整理原始思维链,使其更易读并按需翻译,尽量保持原始风格。但有网友指出,若没有DeepSeek,或许看不到o3-mini哪怕是「阉割版」的思维链。

© 版权声明
智谱清言 - 国产最强AI模型