OpenAI公开o3-mini「思维链」，真CoT还是总结器？

AI快讯1年前 (2025)发布 niko

近日，OpenAI公开了o3-mini的「思维链」（CoT），这一举动在业内掀起了波澜。此前，OpenAI一直对其模型的思维过程有所保留，此次公开引发了广泛关注。

就像当被问到「怎么今天不是星期五啊😅」，在展示的CoT中，o3-mini呈现出一步步思考的过程。它先判断这个问题可能是用户的幽默表达，感觉本周该结束却还未结束，然后运用Zeller公式计算，确认2025年2月6日确实是星期四，即使考虑闰年特殊情况也如此，最后给出回答并提供情绪鼓励。不过，很快就有人质疑这是否是「真的CoT」。

没多久真相大白。OpenAI研究员Noam Brown发文称，此次放出的并非模型原始的CoT。TiborBlaho也指出，所谓的CoT不过是个「总结器」。奥特曼解释说，他们在努力整理原始CoT以提升可读性，必要时提供翻译，尽量保持原始内容忠实度。

OpenAI研究员NoamBrown提到，在o1-preview发布前，向他人介绍草莓时看到CoT的实时演示，那是很多人的「啊哈时刻」，大家意识到这将是重大突破。对于全新的o3-miniCoT，NoamBrown还分享了独家玩法，例如井字棋问题，o3-mini是目前第一个能持续正确回答该问题的模型，虽然CoT有些不稳定，但最终还是解决了问题。

有人认为，OpenAI遮遮掩掩放出高仿CoT，效果适得其反。真实的CoT可充当prompt调试器，引导模型，而总结性CoT会造成混淆、引入错误，增加调试难度。相比之下，DeepSeekR1直接暴露了模型的CoT对提示效果的影响，且有人对比后觉得DeepSeek的产品更自然。

OpenAI此次植入CoT总结器，疑似是被DeepSeek R1的强势崛起吓到。o3-mini发布当天，网友在RedditAMA在线问答中询问能否看到模型思考的所有token，奥特曼称会展示更详细版本，首席产品官KevinWeil则暗示是否展示所有内容待定。如今公开的内容让大家失望，毕竟DeepSeek早已展示完整原始CoT。

OpenAI发言人表示，增加后处理步骤是为提高清晰度和安全性，模型会审查原始思维链，移除不安全内容并简化复杂思想，还能让非英语用户用母语接收思维链，创造友好体验。但大家都明白，这背后针对的是谁。

# AI快讯

文章版权归作者所有，未经允许请勿转载。