DeepSeek与o3-mini激烈交锋,开源策略反思引发AI行业巨变

AI快讯3天前发布 niko
5 0

春节期间,AI领域热度持续攀升,DeepSeek成为当之无愧的焦点,持续刷屏霸榜。在这一背景下,OpenAI推出全新推理模型o3-mini,试图应对DeepSeek带来的挑战,二者的竞争态势引发广泛关注。

OpenAI在Reddit回应时多次提及DeepSeek。OpenAIAPI研究主管称o3-mini相比美国托管版本的DeepSeek有竞争力,但阿尔特曼也承认OpenAI领先优势变小,还反思闭源策略,认为站在了历史错误的一边,并表示将效仿DeepSeek,更多揭示推理模型的“思考过程”。同时,OpenAI还剧透了多项新进展。

DeepSeek成功的背后有诸多关键因素。半导体研究和咨询公司SemiAnalysis报告显示,其GPU投资超5亿美元,拥有至少约5万块Hopper架构的GPU。600万美元仅为预训练运行的GPU成本,不涵盖硬件研发等重要部分。为吸纳人才,该公司曾为有前途的候选人提供超130万美元年薪。

在技术创新方面,DeepSeek成绩斐然。其关键创新多头潜注意力(MLA)将每个查询KV量减少约93.3%,显著降低推理价格。此外,DeepSeek在模型预训练和后训练方面也有独特之处,利用多标记预测(MTP)提高模型性能,基于门控网络提升训练效率并降低推理成本。

DeepSeek的发布对行业影响深远,改变了中美AI竞争格局。中国企业在开源领域的积极作为,让美国重新审视限制开源的策略。从产业竞争格局看,它重塑了全球AI产业版图,促使各国重新思考AI发展战略。

© 版权声明

相关文章

暂无评论

暂无评论...