O1推理模型预示着推理技术的新浪潮。在最新的访谈中,获得了菲尔兹奖的数学专家表示,AI有潜力协助重新构建数学的框架,并且在前所未有的范围内处理数学问题,引领我们走向一次全新的发现时代。
最近,一个机构连续推出了两版o1模型,将o1的热度推向了顶峰。著名的数学家表达了对即将发布的Day 3活动的期待,感觉时间显得尤为漫长。在更新的第一天,发布的完整版o1在数学和编码能力方面相较于之前的预览版得到了显著提升,其中数学性能提高了27%,Pro版更是惊人地增加了36%。作为o1的先锋用户之一,在一场由研究副总主持的访谈中,与机构高级副总畅谈o1推理模型给数学未来带来的变革。
这次访谈由机构的科学政策与合作负责人主持,对谈以一个小时的讨论和半小时的问答环节组成,其内容丰富而深刻。自从o1预览版发布以来,有出版物曾表示,数学家预言了一个前所未有的、由AI驱动的‘工业级数学’时代的到来。在短期内,AI并不是独立的创造性合作伙伴,而是更多地在扮演着数学家假设和方法的催化剂的角色。简而言之,AI目前只是作为一种辅助工具存在。这种新的数学合作模式有助于揭开知识的神秘面纱,同时保持人类创造力的核心位置。
一个全新的发现时代,正式开启
数学家认为,这可能标志着一个新发现时代的开启。目前数学家们只能同时聚焦于一个问题,但在利用新的工具后,我们或许可以同时处理数百甚至数千个问题,同时开展不同类型的数学研究。仅仅是这种可能性就让他感到非常兴奋。副总证实称,在过去一年中,我们的主要关注点之一确实是推理能力。
从GPT-4学习了丰富的世界知识后,团队稍微转移了研究的重点。GPT-4是一个智能模型,但在很多方面表现得也非常不足,简单谜题上会犯错误,经常过分依赖先验知识。这表明了模型在深度推理能力上的不足,因此才诞生了O系列模型。这些模型更像是慢思考者,而不是快速思考者。为了给出回应,模型需要花费时间反思问题。
AI解耦数学任务,开启全新协作模式
主持人继续询问数学合作方式的未来。数学一直被认为是一项非常困难的活动。其中一个原因是,它依赖于个人,或者少数人来完成许多不同的任务,以实现一个复杂的目标。想要在数学上取得进展,必须提出问题,找到工具,学习文献,论证和计算,最后以可解释的方式记载。在其他行业,我们也有这样的劳动分工。数学家认为,直到最近我们才开始找到一种解耦这些任务的方法。理论上可以实现这样的合作:不同的人负责构想、计算和写作论文等不同的任务。
他相信,许多人不愿参与数学研究是因为他们看到了成为优秀数学家所需要的完成任务清单。这种全新模式可以解耦重复性工作,使其变得更加模块化,让AI和人类各自完成适合的任务。另一个问题是在不考虑AI的情况下,最大规模的数学合作项目中能够同时合作的人数上限是多少。数学家解释说,在现实中,限制大概是5-6人。超过这个阈值,就变得非常困难,因为必须互相检查彼此的工作等。目前,GitHub上已有一些众包任务是以形式化的语言如Lean来实现的,所有的贡献都可以被验证。
数学与AI合作的未来
关于年轻数学家,数学家认为他们需要保持灵活性,因为数学已经逐步变成了一个考验协作性的技术性学科。要利用好AI,必须用人类的聪明才智去驯服和监督它,而不是将AI视作一根有魔法的棒子。
而对于“不鼓励人们盲目相信AI”的观点,副总强调了对AI能力的怀疑可以提升我们与AI工具的协作效率。他还鼓励学生认真学好自己领域内的技术知识,并参与一些人工智能相关的研究。
在讨论到解决问题时,我们达成了一种共识:AI的问题解决与人类是互补的。人类需要重新校准对某些问题的难度感知,或许只是因为之前没有尝试使用数据驱动的方法来解决那些经典问题。
AI在数学定理发现和检索方面的潜力
在做数学研究时,一个最让人沮丧的事,莫过于其他人占用了先机。对于问题‘是否在不久的将来,人们可以轻松检索到某些数学定理?’数学家认为,使数学计算机化并支持检索的想法非常棒。o1模型实际上已经有所进展,例如,你可以在知道定理大概是什么但不记得名字的情况下检索,这在很多关键使用场景中非常有用。
对于AI可解释性的理论上滞后的问题,副总鼓励用户在使用大模型时结合搜索结果,模型会引用特定的网站或特定的来源来反映真实情况,以提升模型精确度,并方便用户自行核实结论。需要注意的是,o1目前还不具备搜索能力。
反哺数学
历史上,数学或数学理论总是先出现,然后才有物理学、化学等领域的理论应用。随着AI的进步,例如物理学家使用机器学习来模拟像Pds的计算解和传统方法无法解决的问题。数学家回应说,数学是一条非常宽的双向车道,理论发现永远是双向的。可以想象,非常实用、科学驱动的应用程序可能由于人工智能发现一些新现象而无法解释,或许是经验上的发现,然后促使科研人员利用数学工具去寻找理论解释。
结语
数学家是加州大学洛杉矶分校的数学教授,他的研究领域广泛,包括调和分析、偏微分方程等。副总是机构研究高级副总裁,负责监督高级人工智能计划,推动多个人工智能领域的创新。合作负责人之前是机构的创始人、风险投资公司合伙人;在那里,他帮助创办了多个‘登月’科学组织,包括自动定理证明器。