DeepSeek R1引领AI智能下半场,开启行业新范式

AI快讯2周前发布 niko
13 0
AiPPT - 一键生成ppt

自24Q3起,AI的下半场成为行业焦点。此前OpenAI o1虽提出RL叙事,却未能广泛传播。而DeepSeekR1成功解开RL谜题,推动整个行业迈入新范式,真正开启了智能下半场。

市场上对DeepSeek的探讨热度高涨。如今更值得思考的是,在AI竞赛中该如何前行?总结近期思考,期望为探索下半场提供方向,同时列出几个备受关注的问题:下一个智能突破会在何处出现?若有充足探索资源,应投入到哪些方向?诸如下一代Transformer架构、合成数据突破、更高效的OnlineLearning方式等,又该如何抉择?

DeepSeek是否超越了OpenAI?它超越MetaLlama毋庸置疑,但与OpenAI、Anthropic和Google等第一梯队厂商相比仍有差距。例如Gemini 2.0Flash成本低于DeepSeek,能力强劲且全模态,只因未开源而未产生轰动效果。DeepSeek虽令人振奋,但称不上范式级创新,它将OpenAIo1半遮半掩的范式开源,提升了生态渗透率。从第一性原理看,在Transformer架构下超越第一梯队模型厂商颇具难度,当下人们更期待新的智能架构和范式出现。

严格来讲,DeepSeek没有创造新范式,但其重要意义在于助力RL和test timecompute新范式真正破圈。OpenAI最初发布o1如同抛出一个谜题,DeepSeek则是首位公开解谜者。在DeepSeek发布R1和R1-zero前,仅有少数人实践RL和推理模型,它为行业指明方向,增强了大家对新范式能提升智能的信心,吸引更多AIresearcher投身新范式研究。随着人才涌入,算法创新将更活跃,开源的推动也会吸引更多计算资源投入。在DeepSeek影响下,OpenAI计划发布更多模型并考虑开源,Anthropic和Google也加快了RL研究,行业对新范式的推进加速,中小团队也能在不同领域尝试RL。此外,推理模型的提升有利于agent落地,AIresearcher对agent的研究更具信心,因此可以说DeepSeek开源推理模型推动了行业向Agent的探索。

从Dario的访谈可知,Anthropic对R-1/reasoning model的理解与O系列存在分歧,Dario认为basemodel与reasoning model应是连续光谱,而非独立模型系列,仅做O系列易遇天花板。一直以来,人们疑惑为何Sonnet3.5的coding、reasoning和agentic能力提升显著,而4o却未达相同水平。原来,Anthropic在预训练基础模型阶段就开展了大量RL工作,核心是提升基础模型,否则仅靠RL提升推理模型可能耗尽收益。

DeepSeek的轰动既存在必然性,也有一定偶然性。技术层面,它具备多个亮点:开源方面,OpenAI闭源后留下开源生态空白,DeepSeek抓住机遇,在开源赛道脱颖而出。若将轰动性设为100分,智能提升贡献30分,开源则贡献70分,此前LLaMA开源但效果不佳,说明其智能水平有限。成本便宜也是优势,“Yourmargin is myopportunity”的价值日益凸显。联网与公开CoT为用户带来出色体验,二者结合更是“王炸”,增强了用户信任,促进破圈,不过因服务端不稳定,部分用户流向了Perplexity。RL泛化上,DeepSeekR-1有力推动了reasoning model范式发展,提升了生态接受度。然而,DeepSeekR1推出的时机也带有偶然因素:它原生于中国国内,引发美国科技舆论关注;OpenAI Stargate$500B事件与之形成鲜明对比,吸引大量目光;其对英伟达股价的影响使舆论升温;春节前发布,大众对其文字创作能力的关注推动了传播。

在这场AI竞赛中,参与者可分为ToC、To Developer和To Enterprise(toGovernment)三类。ToC方面,Chatbot受冲击严重,关注度被DeepSeek抢走;开发者环节影响较小,用户未大量迁移;ToEnterprise和ToGovernment的业务决策复杂,不易受影响。从闭源、开源和算力角度看,短期闭源公司受冲击较大,技术神秘感被打破,潜在客户和市场规模受影响,OpenAI更是“吃亏”。但中长期来看,GPU资源充裕的公司将受益,Meta可能借此快速发展,而智能探索需要更多算力投入。从本质上讲,AI产业发展离不开海量算力,这是基本规律。DeepSeek开源推动了AGI进程,带来鲶鱼效应。

关于DeepSeek是否在预训练阶段大量使用蒸馏的CoT数据存疑,若未大量使用,其成果堪称惊艳。蒸馏在基础模型上超越SOTA可能性较小,但DeepSeekR-1强大,若R-1 Zero路径可行,有望超越SOTA。

Google对OpenAI的评价“NoMoat”同样适用于当下。DeepSeek引发的用户迁移表明,智能技术进步迅速,阶段性产品难以形成绝对壁垒。无论是ChatGPT等产品,还是Cursor等开发者工具,都面临用户忠诚度低的问题,模型层和应用层都难以构建护城河。DeepSeek验证了“模型即应用”,这也引发思考:AI时代,智能创新是否比产品和商业模式创新更重要?

DeepSeek面对Chatbot流量,似乎尚未想好应对策略。而是否承接流量的本质问题是,伟大的商业公司和研究实验室能否在一个组织中共存。这考验组织的精力、资源分配、组织能力和战略选择。大公司可能会承接,而作为研究实验室的DeepSeek承接压力巨大。同时要思考Chatbot流量是否为阶段性的,以及在未来智能探索中的地位。从长远看,DeepSeek若不承接,是否会错失机会?

一方面,第一梯队的下一代模型至关重要,但在Transformer架构极限下,能否实现代际提升存疑。另一方面,Agent落地关键,模型微小优势在Agent应用中可能放大。因此,第一梯队厂商既要推动Agent产品落地,也要展示更强大的模型。在技术不确定的当下,天才AIresearchers是关键,探索AGI的组织需投入资源探索新范式。

最后,DeepSeek的表现让人们对中国AI人才充满信心。希望技术无国界,推动全球AI共同发展。

© 版权声明
智谱清言 - 国产最强AI模型