DeepSeek与OmniHuman：中国式改善在AI领域的创新实践

AI快讯1年前 (2025)发布 niko

当市场聚焦DeepSeek对英伟达估值的影响时，英国《金融时报》提出，中国掌握了“Kaizen”这一源自日本的“改善”艺术。这一概念曾助力日本经济腾飞，如今被用于审视中国AI行业，背后是复杂态度。

两周前，字节推出视频生成模型OmniHuman，这款“傻瓜级”垂直模型融合面部动画与姿势调节模型，通过对单一目标的极致工程学优化，从被浪费数据中提炼价值，使生成形象更自然灵动，是中国AI产业“应用”思维的典型产物。

在AI领域，来自东方的“工程科学”力量凸显，DeepSeek堪称佼佼者。其凭借高密度工程创新，实现极致性价比与优越模型表现。在模型架构上，新的混合专家系统（Mixureof Experts，MoE）提升效率；算法层面，多头潜在注意力机制（Multi-Head LatentAttention，MLA）降低推理成本；还有几乎无人工干预的强化学习（RL），DeepSeek-R1-Zero模型在这一过程中展现“顿悟时刻”。

对于DeepSeek的创新，外界看法不一。有人认为其成功进行了系统再创新，遵循经典“改善”逻辑；也有人感叹这是一整个系统的创新。尽管没有做出Transformer模型之外的底层创新，但DeepSeek在该领域实现了有突破价值的工程学创新，推动理论与模型创新。

持续“改善”并非易事，DeepSeek掀开了中国从业者心中的天花板。回顾丰田“Kaizen”式成功，其通过大量模仿、调研市场需求、改善生产流程，重塑美国汽车工业。如今，中国电动车行业从“改善”起步，已走向全面创新。

在人工智能领域，相似轨迹正在上演。DeepSeek-R1-Zero开源RL秘诀，月之暗面的Kimi k1.5推出稀疏注意力机制，字节的豆包大模型1.5Pro采用稀疏MoE架构。在突破Transformer算力桎梏的征程中，中国企业给出相似思路，而DeepSeek的创新更密集、系统。

《金融时报》认为，中国式“改善”凭借人力资源、快速反馈、资金支持等优势，将在AI领域发挥更大作用。在AI发展的探索中，中国创业公司正贡献核心力量，努力实现AI既聪明又低能耗的目标。

# AI快讯

文章版权归作者所有，未经允许请勿转载。