DeepSeek开源多模态模型Janus-Pro，引发全球AI格局震荡

AI快讯1年前 (2025)发布 niko

2025年1月28日农历除夕夜，当中国人沉浸于年夜饭时，中国AI初创公司DeepSeek以开源多模态模型Janus-Pro震撼全球。该模型70亿参数版本在图像生成领域表现卓越，远超OpenAI的DALL-E 3和Stability AI的StableDiffusion。此发布致使美国纳斯达克指数单日暴跌3.07%，英伟达市值蒸发超7000亿美元，创美股历史最大单日跌幅。

DeepSeek一经推出，迅速超越ChatGPT登上全球140多个应用商店榜首（含美国）。其“杀伤力”不仅体现在性能上，更在于颠覆性的算法透明化逻辑。与ChatGPT等强调“拟人化交互”不同，DeepSeek将模型“思考过程”展现给用户。比如被问“strawberry有几个r”时，模型会反复推演50秒后给出正确答案。这种“笨拙的真实”揭示了AI基于统计机器学习的数据拟合工具本质。

算法透明化有双重意义。一方面是技术祛魅，通过展示算法决策链条，用户能看清AI局限性，如简单问题上的低效暴露了其对场景和数据的依赖。另一方面是信任构建，在医疗、法律等高风险领域，透明化是突破“信任阈值”的关键。此前Gartner调查显示，64%的用户拒绝在客服场景使用AI，而DeepSeek的“开卷式”逻辑或能改变这一局面。这场透明化革命，被复旦大学张奇教授称为“撕开AI幻觉的最后一层纱”，让人类意识到AI应成为“超级工具”而非“替代人类”。

DeepSeek的崛起触动了美国科技与政治精英的神经。马斯克质疑“中国公司一定从美国获得了更高端芯片”，这反映出其双重焦虑，既担忧技术路线被超越，又想为自家xAI争取政策倾斜。但DeepSeek通过异构计算架构（CPU+FPGA+ASIC混合部署）和动态负载均衡算法，将单位算力产出提升2倍，在英伟达GPU受限的情况下实现性能突破。特朗普称DeepSeek“给美国产业敲响警钟”，随后美国参议院外交关系委员会听证会上，智库代表提议“偷走中国最好的工程师”，美国的焦虑从技术层蔓延到生态层。长期以来，OpenAI等企业奉行“堆算力、拼参数”的竞赛逻辑，而DeepSeek以RL（强化学习）为核心的训练架构，将模型训练成本砍至OpenAI的3%-5%，时间从6个月压缩到6天，动摇了硅谷的叙事霸权。

DeepSeek的成功源于中国AI产业对“算法文化自信”的实践。在文化禀赋方面，与ChatGPT依赖西方语料库不同，DeepSeek以中国古典诗词为训练基底，在古诗词创作、时事评论等场景有独特优势，形成技术护城河。在场景化落地方面，从医疗问诊到法律咨询，DeepSeek的后期训练贴合中国政策与社会需求，如处理中医诊断建议时能结合《黄帝内经》等典籍，西方模型则无能为力。中国团队还在算力优化、数据精简、开源生态等方面发力，将“实用主义”发挥到极致，这种“低成本、高敏捷”的模式被称为“AI领域的农村包围城市”。

DeepSeek引发的震荡本质是“AI话语权”的文明博弈。西方以数据垄断和硬件霸权为基础，追求“黑箱式”通用智能；中国以透明化和场景化为核心，强调“工具属性”与社会协同。张奇教授指出，当前AI底层范式有局限，依赖统计相关性而非因果逻辑，DeepSeek的透明化实验或能为突破瓶颈提供新思路。当地时间1月29日，美国国会提出《2025年美国人工智能能力与中国脱钩法案》，禁止下载或使用DeepSeek，这暗示了地缘政治隐喻，美国的围堵是对“叙事权流失”的应激反应，而DeepSeek的崛起证明了中国模式的可行性。

除夕夜的DeepSeek带来的不仅是技术突破，更照亮了全球AI权力格局重构的黎明。算法透明化从技术选择升华为文明叙事，意义超越商业竞争。ChatGPT试图成为“全能替身”却因伦理争议遇阻，DeepSeek甘当“透明工具”在多领域扎根。这场“烟花”提醒我们，真正的技术自信在于直面局限。

# AI快讯

文章版权归作者所有，未经允许请勿转载。