OpenAI通用推理模型夺IMO金牌,GPT-5呼之欲出引陶哲轩点评

未分类25秒前发布 niko
1 0
AiPPT - 一键生成ppt

OpenAI通用推理模型抢得IMO金牌先机

爆料显示,谷歌DeepMind的AI模型早在本周五就已拿下IMO金牌,然而因内部审核流程繁琐,需等到下周一市场部批准后才能官宣。OpenAI抓住这一机会,用全新通用推理模型刷题后迅速公开结果,占尽风头。谷歌DeepMind研究员对此进行了调侃。

通用推理模型的独特优势与意义

OpenAI的推理研究员NoamBrown表明,该通用推理模型并非专为IMO设计,而是融合了全新实验性通用技术的推理LLM,在难以验证的任务上表现出色。相比以往基准,IMO问题需要更高层次的持续创造性思维,此模型在推理时间跨度上逐步进步,思考效率更高,且在测试时计算能力和效率方面有很大提升空间。它的进展超越了明确、可验证奖励的强化学习范式,有望构建像人类数学家一样复杂且无懈可击的论证。

GPT-5发布的铺垫与预期

奥特曼针对OpenAI拿下IMO金牌发声,强调这是LLM做数学题,是朝着AGI迈进的主要部分。其实,这一事件或是为GPT-5发布提前造势。不过,奥特曼也谨慎调低了大家对GPT-5的预期,指出它是实验性模型,数月内不会发布具备IMO金牌水平能力的模型。

陶哲轩对IMO金牌争议的点评

菲尔兹奖得主陶哲轩针对IMO金牌得主背后的争议公开表达看法。他认为在缺乏受控测试环境的情况下,AI的数学能力难以准确评估。很多人对AI能力存在极端误解,实际上其能力受计算资源、指令质量和输出要求等多种因素影响。他以人类IMO竞赛形式的改变为例,说明竞赛形式变化会使难度和结果大不相同,警示在缺乏统一测试标准时,对比不同AI模型或AI与人类选手的IMO表现没有意义。

© 版权声明
Trea - 国内首个原生AI IDE