AlphaGeometry2 攻克国际数学奥林匹克竞赛几何难题，性能全面提升

AI快讯6个月前发布 niko

国际数学奥林匹克竞赛（IMO）这一令人类高中生头疼的难题，如今被人工智能取得重大突破。GoogleDeepMind团队的几何解题系统AlphaGeometry2，在解决IMO几何问题上展现出卓越实力。

近期研究显示，AlphaGeometry2解决了84%（42/50）的几何难题，表现首次超过IMO平均金牌得主（40.9/50）的水平。去年7月，它“联手”AlphaProof，在IMO中首次达到银牌获得者的水平。

AlphaGeometry2是一个神经符号混合系统，语言模型基于gemini，并在更多合成数据上从头训练。这使其能应对更具挑战性的几何问题，如物体运动、线性方程等。

该系统使用的符号引擎比前身快两个数量级，面对新问题，采用新颖的知识共享机制实现不同搜索树的先进组合。AG2结合语言模型和符号推理引擎，采用混合推理方法，在解题率、搜索算法等方面都有重大改进。

AG2扩展了语言，新增轨迹相关谓词、能解析线性方程、增加新几何谓词，语言覆盖率从66%提高到88%。此外，它采用Gemini语言模型，数学推理能力更强，训练数据大幅扩展了数学知识库。

同时，AG2采用新型搜索算法（Shared Knowledge SeARCh Trees，SKEST），引入知识共享机制，提升了IMO竞赛求解能力。并且，AG2求解速度提升300倍，新增处理“双点”能力。

尽管AG2取得突破，但仍有局限性，部分涉及变量点个数、不等式等类型的题目未能求解。未来，AlphaGeometry的改进方向包括处理不等式和非线性方程问题，以及进一步改进自动数学公式化技术。

研究表明，AG2能生成辅助构造和完整证明，这意味着当前语言模型有潜力独立运行，符号操作和神经网络的结合，是探索可泛化AI的有希望道路。

文章版权归作者所有，未经允许请勿转载。