OpenAI公开o3-mini「思维链」,真CoT还是总结器?

AI快讯2周前发布 niko
14 0
AiPPT - 一键生成ppt

近日,OpenAI公开了o3-mini的「思维链」(CoT),这一举动在业内掀起了波澜。此前,OpenAI一直对其模型的思维过程有所保留,此次公开引发了广泛关注。

就像当被问到「怎么今天不是星期五啊😅」,在展示的CoT中,o3-mini呈现出一步步思考的过程。它先判断这个问题可能是用户的幽默表达,感觉本周该结束却还未结束,然后运用Zeller公式计算,确认2025年2月6日确实是星期四,即使考虑闰年特殊情况也如此,最后给出回答并提供情绪鼓励。不过,很快就有人质疑这是否是「真的CoT」。

没多久真相大白。OpenAI研究员Noam Brown发文称,此次放出的并非模型原始的CoT。TiborBlaho也指出,所谓的CoT不过是个「总结器」。奥特曼解释说,他们在努力整理原始CoT以提升可读性,必要时提供翻译,尽量保持原始内容忠实度。

OpenAI研究员NoamBrown提到,在o1-preview发布前,向他人介绍草莓时看到CoT的实时演示,那是很多人的「啊哈时刻」,大家意识到这将是重大突破。对于全新的o3-miniCoT,NoamBrown还分享了独家玩法,例如井字棋问题,o3-mini是目前第一个能持续正确回答该问题的模型,虽然CoT有些不稳定,但最终还是解决了问题。

有人认为,OpenAI遮遮掩掩放出高仿CoT,效果适得其反。真实的CoT可充当prompt调试器,引导模型,而总结性CoT会造成混淆、引入错误,增加调试难度。相比之下,DeepSeekR1直接暴露了模型的CoT对提示效果的影响,且有人对比后觉得DeepSeek的产品更自然。

OpenAI此次植入CoT总结器,疑似是被DeepSeek R1的强势崛起吓到。o3-mini发布当天,网友在RedditAMA在线问答中询问能否看到模型思考的所有token,奥特曼称会展示更详细版本,首席产品官KevinWeil则暗示是否展示所有内容待定。如今公开的内容让大家失望,毕竟DeepSeek早已展示完整原始CoT。

OpenAI发言人表示,增加后处理步骤是为提高清晰度和安全性,模型会审查原始思维链,移除不安全内容并简化复杂思想,还能让非英语用户用母语接收思维链,创造友好体验。但大家都明白,这背后针对的是谁。

© 版权声明
智谱清言 - 国产最强AI模型