国际数学奥林匹克竞赛(IMO)这一令人类高中生头疼的难题,如今被人工智能取得重大突破。GoogleDeepMind团队的几何解题系统AlphaGeometry2,在解决IMO几何问题上展现出卓越实力。
近期研究显示,AlphaGeometry2解决了84%(42/50)的几何难题,表现首次超过IMO平均金牌得主(40.9/50)的水平。去年7月,它“联手”AlphaProof,在IMO中首次达到银牌获得者的水平。
AlphaGeometry2是一个神经符号混合系统,语言模型基于gemini,并在更多合成数据上从头训练。这使其能应对更具挑战性的几何问题,如物体运动、线性方程等。

该系统使用的符号引擎比前身快两个数量级,面对新问题,采用新颖的知识共享机制实现不同搜索树的先进组合。AG2结合语言模型和符号推理引擎,采用混合推理方法,在解题率、搜索算法等方面都有重大改进。
AG2扩展了语言,新增轨迹相关谓词、能解析线性方程、增加新几何谓词,语言覆盖率从66%提高到88%。此外,它采用Gemini语言模型,数学推理能力更强,训练数据大幅扩展了数学知识库。

同时,AG2采用新型搜索算法(Shared Knowledge SeARCh Trees,SKEST),引入知识共享机制,提升了IMO竞赛求解能力。并且,AG2求解速度提升300倍,新增处理“双点”能力。
尽管AG2取得突破,但仍有局限性,部分涉及变量点个数、不等式等类型的题目未能求解。未来,AlphaGeometry的改进方向包括处理不等式和非线性方程问题,以及进一步改进自动数学公式化技术。
研究表明,AG2能生成辅助构造和完整证明,这意味着当前语言模型有潜力独立运行,符号操作和神经网络的结合,是探索可泛化AI的有希望道路。
© 版权声明
文章版权归作者所有,未经允许请勿转载。