经过急速发展的两年,大模型行业的现状如何?曾经百家争鸣的景象不再,取而代之的是两大速度之争:技术迭代与产品更新的速度,以及商业化赚钱和应用落地的速度加快。
技术与产品迭代的迅猛发展直接推动了大模型行业的激烈竞争。从语言大模型到3D生成大模型,行业几乎每隔几个月就涌现出令人耳目一新的大模型。技术的发展不仅带动了整个行业的进步,也将前瞻性的大模型厂商推向了聚光灯下。然而,技术的快速迭代也给这些企业带来了商业化的压力。
特别是进入今年下半年,行业的趋势变得更加微妙。市场逐渐减少对大模型的追捧,资本也回归理性。巨头如阿里、字节等明显加快了投入的步伐,一边吸收大模型创业公司的核心人才,一边推出一系列AI产品;而创业公司则开始重新评估自身的发展路线,国内的“AI六小虎”中已有两家转向AI应用的开发。这正是行业商业化效率的体现。
在大模型赛道高度拥挤的当下,算力成本上涨和算力分配有限对创业公司形成巨大压力。正如中国工程院外籍院士张亚勤所言:AI大模型赛道的最后胜利将仅属于少数玩家。
未来大模型的形态尚不确定,但技术仍在快速迭代,新场景不断出现,商业化也在探索之中。过去两年,大模型行业涌现出许多惊艳时刻,如今行业的竞争激烈前所未有,无论是领先者还是追赶者都有机会在这场竞争中获得更多的市场份额。
从2D到3D:大模型迭代的新里程碑
从ChatGPT开始,AI新一轮浪潮已经持续了两年。大模型占据了中心位置,吸引了无数玩家的关注。围绕大模型的技术与应用的竞争日趋白热化,全球目前有467个大模型。以ChatGPT为代表的大语言模型虽然亮眼,但其局限性也日益凸显,特别是在物理和社会环境互动以及价值观理解方面。
为了寻找更具“类人”特征的模型,大模型行业不断进化,其中包括今年12月由李飞飞创立的World Labs推出的“世界模型”,能在单个图像基础上生成3D世界。与此同时,Google Deepmind的Genie 2和OpenAI的o1系列模型也展现了更高级的推理和“思考”能力。这些前沿技术不仅提升了大模型的逻辑思考能力,也让人们更接近AGI的目标。
AI视频:新的竞技场
今年2月,OpenAI的视频生成模型Sora再次推动行业竞争。从Sora开始,一句文字就能生成视频成为可能,引发全球大模型玩家的追赶。不仅是海外的谷歌、Luma、Runway等公司,国内的生数科技Vidu、快手可灵、字节即梦等也纷纷加入这场竞技。
随着视频生成大模型的生成能力进入新的阶段,从简单的“有没有”到“好不好用”的转变,如何让产品更加实用成为关键。快手可灵、字节即梦等公司通过不断的迭代升级,让AI视频生成技术更加成熟,快手可灵能够直接输出1080p高清视频,支持更复杂的文本描述,而字节的模型则在动态和运镜方面展现了更多能力。
尽管AI视频生成技术的商业潜力巨大,但其在商业生产和用户娱乐方面的真实性和视频连贯性仍然面临挑战。同时,高昂的成本也是一个不容忽视的问题。
商业化与效率:行业发展的新焦点
大模型行业的两年发展,不仅带来了技术革命,也使得行业变得更加理智。市场对大模型厂商的期待不再只是技术上的突破,而是在模型中长出能落地的应用,并为各行各业提供效率上的帮助。商业化成为了大模型行业的焦点。
从竞争激烈的“百模大战”到今年的“应用之战”,商业化始终是大模型行业绕不开的话题。高昂的研发成本和运行成本使得大模型企业面临巨大挑战。一些AI独角兽开始从预训练模型转向AI应用的开发,以适应市场的变化。
行业巨头如字节跳动、阿里云、腾讯云等也在不断推出新的AI应用,涵盖了娱乐、对话、智能体等多个领域。尽管面临市场对其巨额AI投入何时能获得回报的质疑,巨头们依然坚定投入。
随着AI技术的不断进步,行业对大模型能力的理解也在不断深化。特别是OpenAI的o1系列模型打破了预训练的瓶颈,使得商业应用迎来了新的可能。行业的淘汰赛已经开始,谁能在这场竞争中胜出,将由市场来回答。