DeepSeek R1引领AI智能下半场，开启行业新范式

自24Q3起，AI的下半场成为行业焦点。此前OpenAI o1虽提出RL叙事，却未能广泛传播。而DeepSeekR1成功解开RL谜题，推动整个行业迈入新范式，真正开启了智能下半场。

市场上对DeepSeek的探讨热度高涨。如今更值得思考的是，在AI竞赛中该如何前行？总结近期思考，期望为探索下半场提供方向，同时列出几个备受关注的问题：下一个智能突破会在何处出现？若有充足探索资源，应投入到哪些方向？诸如下一代Transformer架构、合成数据突破、更高效的OnlineLearning方式等，又该如何抉择？

DeepSeek是否超越了OpenAI？它超越MetaLlama毋庸置疑，但与OpenAI、Anthropic和Google等第一梯队厂商相比仍有差距。例如Gemini 2.0Flash成本低于DeepSeek，能力强劲且全模态，只因未开源而未产生轰动效果。DeepSeek虽令人振奋，但称不上范式级创新，它将OpenAIo1半遮半掩的范式开源，提升了生态渗透率。从第一性原理看，在Transformer架构下超越第一梯队模型厂商颇具难度，当下人们更期待新的智能架构和范式出现。

严格来讲，DeepSeek没有创造新范式，但其重要意义在于助力RL和test timecompute新范式真正破圈。OpenAI最初发布o1如同抛出一个谜题，DeepSeek则是首位公开解谜者。在DeepSeek发布R1和R1-zero前，仅有少数人实践RL和推理模型，它为行业指明方向，增强了大家对新范式能提升智能的信心，吸引更多AIresearcher投身新范式研究。随着人才涌入，算法创新将更活跃，开源的推动也会吸引更多计算资源投入。在DeepSeek影响下，OpenAI计划发布更多模型并考虑开源，Anthropic和Google也加快了RL研究，行业对新范式的推进加速，中小团队也能在不同领域尝试RL。此外，推理模型的提升有利于agent落地，AIresearcher对agent的研究更具信心，因此可以说DeepSeek开源推理模型推动了行业向Agent的探索。

从Dario的访谈可知，Anthropic对R-1/reasoning model的理解与O系列存在分歧，Dario认为basemodel与reasoning model应是连续光谱，而非独立模型系列，仅做O系列易遇天花板。一直以来，人们疑惑为何Sonnet3.5的coding、reasoning和agentic能力提升显著，而4o却未达相同水平。原来，Anthropic在预训练基础模型阶段就开展了大量RL工作，核心是提升基础模型，否则仅靠RL提升推理模型可能耗尽收益。

DeepSeek的轰动既存在必然性，也有一定偶然性。技术层面，它具备多个亮点：开源方面，OpenAI闭源后留下开源生态空白，DeepSeek抓住机遇，在开源赛道脱颖而出。若将轰动性设为100分，智能提升贡献30分，开源则贡献70分，此前LLaMA开源但效果不佳，说明其智能水平有限。成本便宜也是优势，“Yourmargin is myopportunity”的价值日益凸显。联网与公开CoT为用户带来出色体验，二者结合更是“王炸”，增强了用户信任，促进破圈，不过因服务端不稳定，部分用户流向了Perplexity。RL泛化上，DeepSeekR-1有力推动了reasoning model范式发展，提升了生态接受度。然而，DeepSeekR1推出的时机也带有偶然因素：它原生于中国国内，引发美国科技舆论关注；OpenAI Stargate$500B事件与之形成鲜明对比，吸引大量目光；其对英伟达股价的影响使舆论升温；春节前发布，大众对其文字创作能力的关注推动了传播。

在这场AI竞赛中，参与者可分为ToC、To Developer和To Enterprise（toGovernment）三类。ToC方面，Chatbot受冲击严重，关注度被DeepSeek抢走；开发者环节影响较小，用户未大量迁移；ToEnterprise和ToGovernment的业务决策复杂，不易受影响。从闭源、开源和算力角度看，短期闭源公司受冲击较大，技术神秘感被打破，潜在客户和市场规模受影响，OpenAI更是“吃亏”。但中长期来看，GPU资源充裕的公司将受益，Meta可能借此快速发展，而智能探索需要更多算力投入。从本质上讲，AI产业发展离不开海量算力，这是基本规律。DeepSeek开源推动了AGI进程，带来鲶鱼效应。

关于DeepSeek是否在预训练阶段大量使用蒸馏的CoT数据存疑，若未大量使用，其成果堪称惊艳。蒸馏在基础模型上超越SOTA可能性较小，但DeepSeekR-1强大，若R-1 Zero路径可行，有望超越SOTA。

Google对OpenAI的评价“NoMoat”同样适用于当下。DeepSeek引发的用户迁移表明，智能技术进步迅速，阶段性产品难以形成绝对壁垒。无论是ChatGPT等产品，还是Cursor等开发者工具，都面临用户忠诚度低的问题，模型层和应用层都难以构建护城河。DeepSeek验证了“模型即应用”，这也引发思考：AI时代，智能创新是否比产品和商业模式创新更重要？

DeepSeek面对Chatbot流量，似乎尚未想好应对策略。而是否承接流量的本质问题是，伟大的商业公司和研究实验室能否在一个组织中共存。这考验组织的精力、资源分配、组织能力和战略选择。大公司可能会承接，而作为研究实验室的DeepSeek承接压力巨大。同时要思考Chatbot流量是否为阶段性的，以及在未来智能探索中的地位。从长远看，DeepSeek若不承接，是否会错失机会？

一方面，第一梯队的下一代模型至关重要，但在Transformer架构极限下，能否实现代际提升存疑。另一方面，Agent落地关键，模型微小优势在Agent应用中可能放大。因此，第一梯队厂商既要推动Agent产品落地，也要展示更强大的模型。在技术不确定的当下，天才AIresearchers是关键，探索AGI的组织需投入资源探索新范式。

最后，DeepSeek的表现让人们对中国AI人才充满信心。希望技术无国界，推动全球AI共同发展。

# AI快讯

文章版权归作者所有，未经允许请勿转载。