GPT-5研发困境重重，AI技术发展的转折与未来

即使在圣诞假期中某AI机构刷新了ARC-AGI测试，它的AI技术与人工通用智能AGI仍有一段距离。最近该机构的新一代AI模型GPT-5面临着难以预计的困境，竞争对手的加速赶上，使其面临前所未有的竞争压力。

在一场为期12天的特别活动中，谷歌发布数个重要产品，其中包括原生多模态的全新版本、令人印象深刻的AI平台和AI智能体，以及引发互联网热潮的新产品。它们的光芒使该AI机构的节日活动黯然失色。

活动最后一天，该机构发布了新一代推理模型o3，其在极度艰深的ARC-AGI基准上的成绩尤其突出。模型的评分结果显示，由o1至o3的发展缩短至1个月，近期关于规模定律触顶的讨论不攻自破，为机构争得一口气。
目前，o3仅对特定的安全研究人员开放，但公众对GPT-5的期盼越发迫切。该模型的发布时间仍属未知。自2023年GPT-4发布至今，市场和投资者的耐心已消磨日久。
市场份额调查显示，该机构在企业AI领域的份额由50%骤降至34%，而其竞争者市场份额翻倍。另一个需要注意的动态是，由于机构模型性价比不高，有消息称其合作伙伴可能考虑用非该机构模型来升级办公助手。
竞争对手包括谷歌和Anthropic都在追赶，而合作伙伴的态度转变，使得该机构的处境不再像之前那样独占市场。
尤其是在GPT-5的训练过程中，新问题不断涌现，且模型效果未达到预期——提升并不足够明显，与大规模模型运行成本不成比例。甚至有报道指出，一个为期6个月的训练就耗资5亿美元，未来模型的耗资将更为惊人。
在训练大型模型时，研究人员需将持续进行数月的复杂工作，将全球的知识输入到AI系统中。此前训练GPT-4的成本就已超过1亿美元，而未来型号的成本预计将会更高。每次失败就像火箭突然爆炸般的沉痛，因此研究人员通过小规模实验减轻这种风险。但是GPT-5在预测试阶段就已经出现了大量问题。
据报道称，标志为Arrakis的项目是新设计方案预测试，进展异常缓慢，预指更大的训练的耗时和耗资。研究结果显示，开发GPT-5的道路比预期更曲折。
该机构研究人员决定对方案进行技术优化，并着力解决数据不足的问题。为了提升模型的智能水平，需要更多的数据，常用数据却日渐紧张。
所以，他们采取从无开始构建数据集的措施。为提供学习材料，招募了包括工程师和数学家在内的专家，并邀请他们详述工作过程和解题思路。
这不仅为模型提供更多的数据，也提供了解决新问题的系统方案。Turing等和该机构合作的公司，要求工程师高效解决复杂问题或进行数学计算，将解决方案和步骤反馈到模型训练数据中。
如此一来，又一个不可忽略的问题浮出水面，人工智能业界众多人物也开始犯难，这就是数据不足的问题——大数据像是燃油一样正逐渐耗尽。
解决这一问题的全新策略是增加模型推理时间。通过让模型在解决问题时延长‘思考’时间，可以使模型在没有经过训练的情况下解决更复杂的任务。o1提供了多答案生成机制，让模型从每次回答中学习优化。但是，也出现了质疑声音，称推理模型可能仅在复现数据模式，而非真正理解。
随着o3在基准测试中明显优势的展现，我们不禁要问离AGI还有多远？一系列的五万美元任务体现了模型在没有计算量限制时的极致表现，但问题的关键在于提升准确率的代价极为巨大。
在尝试中，o3表现出一些错误，并且有时候难以记住重复元素的数量。但无论如何，值得注意的是，基于经验的评估和整体表现是否可作为模型发展的依据，因为GPT-5被期待在多学科和任务上实现重大飞跃。
GPT-5是否能解锁新的发现，依然在评估阶段，不过可以肯定的是，在某些领域上GPT-5有望接近博士水准。然而，广义上，GPT-5的整体表现并不尽如人意。

# AI快讯

文章版权归作者所有，未经允许请勿转载。