OpenAI通用推理模型夺IMO金牌，GPT-5呼之欲出引陶哲轩点评

AI快讯1年前 (2025)发布 niko

OpenAI通用推理模型抢得IMO金牌先机

爆料显示，谷歌DeepMind的AI模型早在本周五就已拿下IMO金牌，然而因内部审核流程繁琐，需等到下周一市场部批准后才能官宣。OpenAI抓住这一机会，用全新通用推理模型刷题后迅速公开结果，占尽风头。谷歌DeepMind研究员对此进行了调侃。

通用推理模型的独特优势与意义

OpenAI的推理研究员NoamBrown表明，该通用推理模型并非专为IMO设计，而是融合了全新实验性通用技术的推理LLM，在难以验证的任务上表现出色。相比以往基准，IMO问题需要更高层次的持续创造性思维，此模型在推理时间跨度上逐步进步，思考效率更高，且在测试时计算能力和效率方面有很大提升空间。它的进展超越了明确、可验证奖励的强化学习范式，有望构建像人类数学家一样复杂且无懈可击的论证。

GPT-5发布的铺垫与预期

奥特曼针对OpenAI拿下IMO金牌发声，强调这是LLM做数学题，是朝着AGI迈进的主要部分。其实，这一事件或是为GPT-5发布提前造势。不过，奥特曼也谨慎调低了大家对GPT-5的预期，指出它是实验性模型，数月内不会发布具备IMO金牌水平能力的模型。

陶哲轩对IMO金牌争议的点评

菲尔兹奖得主陶哲轩针对IMO金牌得主背后的争议公开表达看法。他认为在缺乏受控测试环境的情况下，AI的数学能力难以准确评估。很多人对AI能力存在极端误解，实际上其能力受计算资源、指令质量和输出要求等多种因素影响。他以人类IMO竞赛形式的改变为例，说明竞赛形式变化会使难度和结果大不相同，警示在缺乏统一测试标准时，对比不同AI模型或AI与人类选手的IMO表现没有意义。

# AI快讯

文章版权归作者所有，未经允许请勿转载。