DeepSeek:中国开源技术栈的关键力量
今年上海世界人工智能大会(WAIC)上,DeepSeek虽未亲临现场,却成为中国开源技术栈叙事的核心。它打破了中国创新的思维惯性,证明开源模型可逼近前沿闭源模型,且能由本土人才实现。同时,开源模型冲击闭源商业体系,中国借此争夺全球市场、提升话语权。前GoogleCEO埃里克·施密特呼吁西方与中国在开源AI模型上加强合作。
“六小虎”企业的表现与创新
“六小虎”企业在WAIC上表现各异。部分企业缺席,部分展位不大,而阶跃星辰和稀宇科技动静较大。稀宇科技创始人闫俊杰鼓励AI初创企业,指出大模型训练差异不仅取决于算力,还与实验设计、研发团队和创意有关。阶跃星辰推出旗舰基础模型Step3,该模型参数规模大,在多项测试中表现突出,被称为“最强开源多模态推理模型”,具备视觉能力,多模态领域也向强化学习过渡。此外,还发布了多模理解生成一体化模型Step3o Vision和第二代端到端语音大模型Step – AUdio 2。
国内企业对DeepSeek的超越尝试
国内企业纷纷以不同方式尝试超越DeepSeek。智谱更新GLM – 4 – 0414,月之暗面K2超越R1 – 0528,蚂蚁数科的大模型超越R1和GPT- o1。在技术创新上,MiniMax的M1引入闪电注意力机制,支持更长推理空间;月之暗面K2改良MuonClip与QK – Clip;阶跃星辰Step3强调对国产芯片的软硬件优化,发起成立“模芯创新生态联盟”。
AI行业的应用落地趋势
当前AI行业重心从基础模型突破转向应用落地。WAIC上谈论智能体与端侧应用增多,机器人企业数量大幅增加,阿里、腾讯等推出相关产品。阶跃星辰和稀宇科技关注终端用户体验和商业化路径,以推动应用落地为目标取得进步,年化收入10亿元成新门槛。
开源技术栈的国际影响
美国对中国开源技术栈解读具地缘竞争意味。本届WAIC上,中国发布《人工智能全球治理行动计划》,提议打造跨国开源社区和平台,做实开源技术栈叙事。