DeepSeek与OmniHuman:中国式改善在AI领域的创新实践

AI快讯3个月前发布 niko
10 0
AiPPT - 一键生成ppt

当市场聚焦DeepSeek对英伟达估值的影响时,英国《金融时报》提出,中国掌握了“Kaizen”这一源自日本的“改善”艺术。这一概念曾助力日本经济腾飞,如今被用于审视中国AI行业,背后是复杂态度。

两周前,字节推出视频生成模型OmniHuman,这款“傻瓜级”垂直模型融合面部动画与姿势调节模型,通过对单一目标的极致工程学优化,从被浪费数据中提炼价值,使生成形象更自然灵动,是中国AI产业“应用”思维的典型产物。

在AI领域,来自东方的“工程科学”力量凸显,DeepSeek堪称佼佼者。其凭借高密度工程创新,实现极致性价比与优越模型表现。在模型架构上,新的混合专家系统(Mixureof Experts,MoE)提升效率;算法层面,多头潜在注意力机制(Multi-Head LatentAttention,MLA)降低推理成本;还有几乎无人工干预的强化学习(RL),DeepSeek-R1-Zero模型在这一过程中展现“顿悟时刻”。

对于DeepSeek的创新,外界看法不一。有人认为其成功进行了系统再创新,遵循经典“改善”逻辑;也有人感叹这是一整个系统的创新。尽管没有做出Transformer模型之外的底层创新,但DeepSeek在该领域实现了有突破价值的工程学创新,推动理论与模型创新。

持续“改善”并非易事,DeepSeek掀开了中国从业者心中的天花板。回顾丰田“Kaizen”式成功,其通过大量模仿、调研市场需求、改善生产流程,重塑美国汽车工业。如今,中国电动车行业从“改善”起步,已走向全面创新。

在人工智能领域,相似轨迹正在上演。DeepSeek-R1-Zero开源RL秘诀,月之暗面的Kimi k1.5推出稀疏注意力机制,字节的豆包大模型1.5Pro采用稀疏MoE架构。在突破Transformer算力桎梏的征程中,中国企业给出相似思路,而DeepSeek的创新更密集、系统。

《金融时报》认为,中国式“改善”凭借人力资源、快速反馈、资金支持等优势,将在AI领域发挥更大作用。在AI发展的探索中,中国创业公司正贡献核心力量,努力实现AI既聪明又低能耗的目标。

© 版权声明
Trea - 国内首个原生AI IDE