AI视频开源模型激战,价格战与创作下沉浪潮来袭

AI快讯4周前发布 niko
10 0
AiPPT - 一键生成ppt

AI视频领域正经历一场技术革新与市场变革。今年2月底,阿里巴巴宣布开源通义万相2.1视频生成模型,这一举措在AI开源领域掀起波澜。

通义万相2.1功能强大,支持文生视频、图生视频任务,低显存需求降低了技术门槛,还能实现无限长1080P视频编解码。它更是全球首个支持中文文字特效生成的视频模型,能深度理解中国风指令,精准模拟物理规律。开源后6天,该模型便登顶HuggingFace趋势榜。

在此之后,腾讯混元HunyuanVideo-I2V、阶跃星辰Step-Video-T2V、昆仑万维SkyReels-V1等新的开源视频生成大模型也陆续登场。腾讯混元HunyuanVideo-I2V开源推理代码和权重,支持多种功能;阶跃星辰Step-Video-T2V在复杂场景生成方面表现出色;昆仑万维SkyReels-V1面向AI短剧创作,生成效果优秀。

闭源视频大模型也不甘示弱,生数科技公布Vidu 2.0版本,字节大力推广“豆包”客户端的视频生成功能。随着这些模型的发展,AI视频创作的格局正在悄然改变。

在价格方面,DeepSeek曾通过技术优化,降低成本,其APi定价仅为OpenAI同类模型的3%,引发行业震动。如今,开源视频大模型的发展让视频生成领域的价格战成为可能。当前可灵、即梦等平台会员定价坚挺,但一个足够普及的视频生成大模型,有望使头部闭源模型API价格下降,改变商业模式。

然而,目前AI视频大模型还无法完全替代真人实拍,仍存在“AI味儿”等问题。但不同平台各有优势,可灵在真实人类动作与高清晰度方面表现突出,即梦对物理世界运动逻辑模拟更精准,生数Vidu在动漫风格化等方面表现出色。

此外,API和本地部署问题也影响着视频生成模型的发展。中小型云服务商积极接入开源模型,但目前对视频生成模型API的调用缺乏普遍方案,本地部署在视频生成方面也面临诸多困难。

值得注意的是,AI视频创作正在逐渐下沉。根据数据,一些头部视频生成大模型的C端使用量大幅增长,随着通用AI客户端加入视频创作功能,更多下沉用户将接触到AI视频。一项技术并非要成熟才向下推广,AI视频生成虽有问题,但不影响普通人使用,未来生成式内容将塑造和改变世界。

© 版权声明
Trea - 国内首个原生AI IDE