DeepSeek与o3-mini激烈交锋，开源策略反思引发AI行业巨变

AI快讯1年前 (2025)发布 niko

春节期间，AI领域热度持续攀升，DeepSeek成为当之无愧的焦点，持续刷屏霸榜。在这一背景下，OpenAI推出全新推理模型o3-mini，试图应对DeepSeek带来的挑战，二者的竞争态势引发广泛关注。

OpenAI在Reddit回应时多次提及DeepSeek。OpenAIAPI研究主管称o3-mini相比美国托管版本的DeepSeek有竞争力，但阿尔特曼也承认OpenAI领先优势变小，还反思闭源策略，认为站在了历史错误的一边，并表示将效仿DeepSeek，更多揭示推理模型的“思考过程”。同时，OpenAI还剧透了多项新进展。

DeepSeek成功的背后有诸多关键因素。半导体研究和咨询公司SemiAnalysis报告显示，其GPU投资超5亿美元，拥有至少约5万块Hopper架构的GPU。600万美元仅为预训练运行的GPU成本，不涵盖硬件研发等重要部分。为吸纳人才，该公司曾为有前途的候选人提供超130万美元年薪。

在技术创新方面，DeepSeek成绩斐然。其关键创新多头潜注意力（MLA）将每个查询KV量减少约93.3%，显著降低推理价格。此外，DeepSeek在模型预训练和后训练方面也有独特之处，利用多标记预测（MTP）提高模型性能，基于门控网络提升训练效率并降低推理成本。

DeepSeek的发布对行业影响深远，改变了中美AI竞争格局。中国企业在开源领域的积极作为，让美国重新审视限制开源的策略。从产业竞争格局看，它重塑了全球AI产业版图，促使各国重新思考AI发展战略。

# AI快讯

文章版权归作者所有，未经允许请勿转载。