AI六小虎:大模型竞争下的分化与抉择

AI快讯1个月前发布 niko
7 0
AiPPT - 一键生成ppt

AI六小虎:大模型时代的先驱与探索者

在国内大模型发展历程中,“AI六小虎”曾是一个显著标志。它们是最早完成10亿 +美元融资,拥有自研千亿参数级大模型,并在国际基准测试中与GPT-4LLaMA等对标较量的创业公司。过去两年多,这些公司围绕模型层、产品层和营销层展开激烈角逐。

第一轮较量:参数争夺与赛道分化

从成立时间看,2023年上半年百川智能、阶跃星辰、零一万物和月之暗面等相继成立,DeepSeek也在这一年诞生,智谱和MiniMax成立时间更早。在模型研发上,各公司各有节奏。百川先后发布多个语言模型;阶跃星辰推出多款千亿、万亿参数模型;零一万物开源发布多款模型;MiniMax的ABAB大模型开放并迭代;智谱不断更新大模型;月之暗面靠长上下文技术崭露头角。

然而,第一轮参数争夺后,因“钱不够、卡不够、数据不够”的困境,大模型参数提升受限。在此背景下,AI六小虎开始分化赛道。百川转向垂直模型,聚焦医疗领域;零一万物放弃超大参数模型训练,转向轻量化模型;智谱、阶跃星辰、MiniMax、月之暗面仍在坚持预训练,但面临不同挑战。

DeepSeek的影响:催化战略决策

DeepSeek凭借“制造业式”成本控制,将推理成本大幅压缩,成为行业焦点。其爆火和开源促使投资人和大模型企业重新审视战略定位。百川智能战略收缩,深耕B端医疗;阶跃星辰技术储备丰富但市场声量待提升;零一万物聚焦轻量级模型,商业化路径明确;Minimax多模态技术有积累,国内外双线布局;智谱持续迭代模型并开源,商业化路径清晰但面临质疑;月之暗面C端产品突出但面临诸多挑战。同时,AI六小虎的分化也为大厂带来赶超机会。

基础模型的抉择:坚持与转向

对于是否投入基础模型研发,大模型公司面临两难。部分人认为,若达不到DeepSeek水平,投入成本过高,现阶段可等其开源新版本。但基座模型对AI生态有重要推动作用,若想突破,需在模型能力和成本控制两方面发力。业内普遍认为,大模型没有绝对技术壁垒,开源成为共识,AI六小虎也需借助开源共建生态。

商业化之路:重要性与挑战

大模型企业纷纷展示商业落地能力,但对于AI六小虎,商业化重要性存在争议。有人认为收缩战线形成单点突破更重要,过早商业化会增加组织复杂度;也有人认为大模型企业需紧跟场景完善商业闭环。普遍来看,ToB领域更被看好,To C领域则面临诸多挑战。

在大模型这场激烈竞争中,AI六小虎作为先驱,虽面临诸多困境,但他们的探索为行业发展提供了宝贵经验。未来,他们能否在“三不够”场景下构建自身生态闭环,值得关注。

© 版权声明
Trea - 国内首个原生AI IDE