Sora惊喜发布,但并非完全呈现。在系列发布会第三天,OpenAI向公众推出了AI视频大模型Sora Turbo,能够生成的视频时长为20秒,仅为初始宣传时的三分之一。而且,并非所有用户都能立即体验Sora Turbo,因为该应用还在小范围测试阶段。
尽管Sora引领了视频大模型行业的浪潮,但它似乎稍显落后于其他竞品。在国内市场,已涌现不少于二十款AI视频大模型,其中包括腾讯、阿里巴巴、字节跳动等行业巨头推出的产品。AI视频大模型能赋予计算机更深层次理解和重构现实世界的能力,同时也能让用户充分发挥创造力和想象力。
这些视频大模型的专业使用场景相对细分,当前基本属于付费服务,免费用户仅能通过系统积分或每日赠送的次数生成视频,不能享受到所有高级功能。对于不太关注AI的朋友来说,可能不太了解国内有哪些优秀的视频大模型。小编就带领大家盘点六款国内知名度较高的AI视频大模型,并分析它们的区别与特点。
在国内外,我国的视频大模型已先行一步,技术上相比竞争对手也显优势。多数已经能识别人类的自然语言指令,而非依赖固定的关键词生成内容,这对视频大模型而言,是技术的小小进步,但却是整个AI行业发展的一大步。它们已能做到将想法或小说内容转化成影像。
在选择视频大模型时,不要急于决定,来看看互联网巨头们各自视频大模型的表现:
1、可灵:作为行业的先行者,在体验上鹤立鸡群。视频大模型需要大量的视频资源,而视频平台在这方面具有先天的优势。Sora发布四个月后,快手科技旗下的AI团队便推出了视频大模型可灵,而今已经发展到1.5版本。根据实际体验,可灵在国内众多视频大模型中的表现足以位列前三。它支持从文本生成视频和图片生成视频,可调节创意想象力和相关性。限免版下,用户使用可灵1.5模型生成最高5秒的高品质视频,而1.0版本能生成10秒视频。在使用图生视频功能时,可灵1.5可输出最多10秒的标准品质或5秒的高品质视频,并支持镜头运动调节。
来源描述的一个视频生成结果是:淡泊宁静的海滩,月色如洗,海边的椰子树轻摇,还有一只懒猫在沙滩上怡然自得地舔着前腿的毛发。生成效果细节丰富,唯一的缺陷是生成的视频发生在白天而非描述中的夜晚。
作为国内首批AI视频大模型,可灵表现非常出色,期望它能尽快推出更长篇的视频生成能力,降低制作微短剧的成本,提升其商业价值。
2、即梦:语言解析能力强,但活力稍显不足。快手推出可灵后,抖音也有了自己的视频大模型即梦。除了基本的视频和图片生成视频,即梦还提供了对视频口型功能的匹配。虽然即梦发布稍晚,但迭代速度很快,目前官网提供三个不同版本的模型。
需要注意的是,即梦模型注册后即送60积分,不同的视频长度对应不同的积分消耗。使用相同的描述语言生成视频,即梦的表现同样出色,但视频中的猫咪动作稍显单调,缺乏生动。尽管如此,即梦对自然语言的理解能力似乎比可灵更胜一筹,除了上述的不足,其他元素都得到了很好的展现。
3、混元:腾讯也推出了自己的视频大模型混元,并在腾讯元宝App和网页端上线。目前,混元仅支持文生视频,每天可以免费生成四次标准品质和两次高品质视频。混元虽然面临着天生的不足,但其背后有腾讯这一国内互联网巨头的支持,预计未来的发展潜力巨大。
4、Vidu:功能齐全,镜头表现自然。作为北京数生科技与清华大学联合研发的AI视频大模型,Vidu虽然可能没有腾讯、字节那样雄厚的财力,但是其性能并不逊色于它们。Vidu的1.5版本支持从文本和图片生成视频,并提供多种参数的调节,免费用户仅生成720P视频。测试中,Vidu的视频质量、自然度以及细节都与可灵和即梦旗鼓相当,只是在沙滩质感上略有不足。
5、清影:与Vidu同出清华大学,差距明显。智谱清言研发的AI视频大模型清影功能丰富,但实际生成的视频让人失望,对于自然语言的理解能力还需提升。
6、PixVerse:画面卓越,动作欠佳。爱诗科技的视频大模型PixVerse功能多样,能够设置特效、风格等元素,生成的视频最长可达8秒。虽然视频画面色调令人愉悦,小猫的毛发细节和水面波纹都呈现得十分到位,但猫咪的动作却显得过于刻意和僵硬。
细节决定成败,在AI视频大模型的竞争中,国内外企业正从无到有的关键跨越,后续需要在自然语言解析能力、画面细节和运镜、视频时长等方面不断升级。只有深入理解人类的自然语言,我们的想象力才能通过视频大模型自由释放,画面和运镜的提升可以带来更好的视频质量,足够长的视频时长才有助力于视频创作。
尽管AI视频大模型公司普遍采用收费模式,但由于高昂的价格和综合成本,真正愿意为之付费的用户并不多。因此,这些公司或需与B端客户合作,针对特定场景开发定制版本,或者加速技术迭代,以满足C端用户的需求。随着亚马逊云科技、谷歌、OpenAI等行业巨头纷纷布局AI视频大模型,并预计未来会有更多竞争者加入,AI视频大模型行业的竞争将会越来越激烈,我们需要加快步伐,利用自身优势创造盈利点来保持竞争力。