阶跃星辰:多模态与Agent引领AGI新进程

AI快讯17小时前发布 niko
1 0
AiPPT - 一键生成ppt

5月8日,阶跃星辰CEO姜大昕现身北京媒体沟通会,提出鲜明观点:多模态领域任一短板,都会延缓AGI进程 ,多模态是实现AGI的必经之路。

阶跃星辰在六小龙中颇为低调,过去两年未参与应用投流,仅在ToC应用有所试水。但它凭借多模态领域的突出表现,成为“多模态卷王”。成立两年发布22款自研基座模型,其中16款为多模态模型,占比超7成。

多模态技术探索尚处早期,与技术路线已收敛的语言模型不同。姜大昕认为,对标语言模型演进时间线,阶跃所押注的“理解+生成一体”原生多模方向,可能处于GPT1.0之前,Transformer刚出现的阶段。多模态融合不能损失单模态性能,阶跃从成立就定下“同一大模型兼顾理解与生成”的发展主线。

做理解和生成是原生多模方向的一体两面。能理解意味着模型需生成端监督以理解画面物体关系;能生成则要求理解来控制生成内容,确保符合物理世界认知。

2025年,多模态重回全球AI舞台中心,推理模型的进步为其技术探索补足拼图。多模态和Agent成为2025年两大关键词。阶跃重点布局Agent领域,已与Oppo、吉利汽车集团等企业合作,将Agent应用于汽车、手机等关键场景。

DeepSeek的成功引发行业思考。它未做投流却潜力巨大,这让人们重新审视AI产品流量增长逻辑。同时,模型突破先于商业化,多模理解生成一体化突破后,有望在具身智能泛化等方面展现价值。

2025年,阶跃将产品“跃问”更名为“阶跃AI”,实现从类chatgpt产品到Agent能力的转变。其智能终端面向ToC,虽与头部企业合作,但最终服务C端用户。阶跃坚持基础大模型研发,认为模型决定应用上限,应用为模型提供场景和数据。

随着模型能力增强,不同阶段解锁不同应用。Agent在2025年火热,爆发需多模态和慢思考能力。阶跃选择智能终端Agent方向,因其能理解用户环境和任务上下文,且终端设备有能力成为Agent。阶跃与头部企业深度合作,如Oppo一键问屏功能使用其多模态模型。成为垂类行业供应商,待探索清楚后,未来也可能自主发展。

© 版权声明
Trea - 国内首个原生AI IDE