GPT-5研发困境重重,AI技术发展的转折与未来

AI快讯1个月前发布 niko
8 0

即使在圣诞假期中某AI机构刷新了ARC-AGI测试,它的AI技术与人工通用智能AGI仍有一段距离。最近该机构的新一代AI模型GPT-5面临着难以预计的困境,竞争对手的加速赶上,使其面临前所未有的竞争压力。

在一场为期12天的特别活动中,谷歌发布数个重要产品,其中包括原生多模态的全新版本、令人印象深刻的AI平台和AI智能体,以及引发互联网热潮的新产品。它们的光芒使该AI机构的节日活动黯然失色。

活动最后一天,该机构发布了新一代推理模型o3,其在极度艰深的ARC-AGI基准上的成绩尤其突出。模型的评分结果显示,由o1至o3的发展缩短至1个月,近期关于规模定律触顶的讨论不攻自破,为机构争得一口气。
目前,o3仅对特定的安全研究人员开放,但公众对GPT-5的期盼越发迫切。该模型的发布时间仍属未知。自2023年GPT-4发布至今,市场和投资者的耐心已消磨日久。
市场份额调查显示,该机构在企业AI领域的份额由50%骤降至34%,而其竞争者市场份额翻倍。另一个需要注意的动态是,由于机构模型性价比不高,有消息称其合作伙伴可能考虑用非该机构模型来升级办公助手。
竞争对手包括谷歌和Anthropic都在追赶,而合作伙伴的态度转变,使得该机构的处境不再像之前那样独占市场。
尤其是在GPT-5的训练过程中,新问题不断涌现,且模型效果未达到预期——提升并不足够明显,与大规模模型运行成本不成比例。甚至有报道指出,一个为期6个月的训练就耗资5亿美元,未来模型的耗资将更为惊人。
在训练大型模型时,研究人员需将持续进行数月的复杂工作,将全球的知识输入到AI系统中。此前训练GPT-4的成本就已超过1亿美元,而未来型号的成本预计将会更高。每次失败就像火箭突然爆炸般的沉痛,因此研究人员通过小规模实验减轻这种风险。但是GPT-5在预测试阶段就已经出现了大量问题。
据报道称,标志为Arrakis的项目是新设计方案预测试,进展异常缓慢,预指更大的训练的耗时和耗资。研究结果显示,开发GPT-5的道路比预期更曲折。
该机构研究人员决定对方案进行技术优化,并着力解决数据不足的问题。为了提升模型的智能水平,需要更多的数据,常用数据却日渐紧张。
所以,他们采取从无开始构建数据集的措施。为提供学习材料,招募了包括工程师和数学家在内的专家,并邀请他们详述工作过程和解题思路。
这不仅为模型提供更多的数据,也提供了解决新问题的系统方案。Turing等和该机构合作的公司,要求工程师高效解决复杂问题或进行数学计算,将解决方案和步骤反馈到模型训练数据中。
如此一来,又一个不可忽略的问题浮出水面,人工智能业界众多人物也开始犯难,这就是数据不足的问题——大数据像是燃油一样正逐渐耗尽。
解决这一问题的全新策略是增加模型推理时间。通过让模型在解决问题时延长‘思考’时间,可以使模型在没有经过训练的情况下解决更复杂的任务。o1提供了多答案生成机制,让模型从每次回答中学习优化。但是,也出现了质疑声音,称推理模型可能仅在复现数据模式,而非真正理解。
随着o3在基准测试中明显优势的展现,我们不禁要问离AGI还有多远?一系列的五万美元任务体现了模型在没有计算量限制时的极致表现,但问题的关键在于提升准确率的代价极为巨大。
在尝试中,o3表现出一些错误,并且有时候难以记住重复元素的数量。但无论如何,值得注意的是,基于经验的评估和整体表现是否可作为模型发展的依据,因为GPT-5被期待在多学科和任务上实现重大飞跃。
GPT-5是否能解锁新的发现,依然在评估阶段,不过可以肯定的是,在某些领域上GPT-5有望接近博士水准。然而,广义上,GPT-5的整体表现并不尽如人意。

© 版权声明

相关文章

暂无评论

暂无评论...