近期,谷歌DeepMind携手陶哲轩等顶尖科学家推出「通用科学人工智能」AlphaEvolve,一举打破矩阵乘法领域56年的效率基准。此前,4×4矩阵乘法的49次标量乘法效率基准已维持半个多世纪,而AlphaEvolve将其改写为48次。这一微小数字的背后,是更快的矩阵乘法算法,具有重大意义,不仅能解决复杂数学难题,还可改进芯片设计、提高数据中心和AI训练效率。在谷歌内部应用中,它加速了gemini架构的大型矩阵乘法运算,缩短了训练时间,还提升了FlashAttention的速度。
突破源于自由探索,算法改进有秘诀
AlphaEvolve的成功秘诀在于让AI“完全自由探索”。它基于AlphaTensor框架,引入进化算法,不依赖预设的“经验法则”或“设计套路”,避免了传统算法的“对称性陷阱”。研究人员让其搜索复数矩阵乘法算法时,意外发现复数算法在实数域同样有效,进而扩大搜索空间,找到仅需48次乘法的复数算法,并通过数学验证。不过,在挑战更大规模矩阵时,AlphaEvolve因缺乏特定归纳偏置未能超越现有最优解,这表明未来需在完全开放搜索和约束之间寻求平衡。但其“开箱即用”的优势明显,可用于数学和科学新发现,还能提供可部署到关键计算堆栈的算法。
核心技术支撑,构建优化闭环
AlphaEvolve的核心技术包括进化算法框架、自动化评估系统和异步分布式运行架构。它以Gemini Flash和GeminiPro模型为基础,前者提升速度,后者增强深度理解。进化算法借鉴“适者生存”理念,对代码种群进行评估和优化,还应用于优化提示词。自动化评估系统通过多维度指标和多场景测试对算法进行量化评价,为优化提供方向。异步分布式运行架构使算法能并行进化,提高效率。此外,AlphaEvolve性能受益于基础语言模型提升,已初步实现递归自我改进,资源消耗灵活,未来将在人机协作基础上提升自动化水平。