AI视频开源模型激战，价格战与创作下沉浪潮来袭

AI视频领域正经历一场技术革新与市场变革。今年2月底，阿里巴巴宣布开源通义万相2.1视频生成模型，这一举措在AI开源领域掀起波澜。

通义万相2.1功能强大，支持文生视频、图生视频任务，低显存需求降低了技术门槛，还能实现无限长1080P视频编解码。它更是全球首个支持中文文字特效生成的视频模型，能深度理解中国风指令，精准模拟物理规律。开源后6天，该模型便登顶HuggingFace趋势榜。

在此之后，腾讯混元HunyuanVideo-I2V、阶跃星辰Step-Video-T2V、昆仑万维SkyReels-V1等新的开源视频生成大模型也陆续登场。腾讯混元HunyuanVideo-I2V开源推理代码和权重，支持多种功能；阶跃星辰Step-Video-T2V在复杂场景生成方面表现出色；昆仑万维SkyReels-V1面向AI短剧创作，生成效果优秀。

闭源视频大模型也不甘示弱，生数科技公布Vidu 2.0版本，字节大力推广“豆包”客户端的视频生成功能。随着这些模型的发展，AI视频创作的格局正在悄然改变。

在价格方面，DeepSeek曾通过技术优化，降低成本，其APi定价仅为OpenAI同类模型的3%，引发行业震动。如今，开源视频大模型的发展让视频生成领域的价格战成为可能。当前可灵、即梦等平台会员定价坚挺，但一个足够普及的视频生成大模型，有望使头部闭源模型API价格下降，改变商业模式。

然而，目前AI视频大模型还无法完全替代真人实拍，仍存在“AI味儿”等问题。但不同平台各有优势，可灵在真实人类动作与高清晰度方面表现突出，即梦对物理世界运动逻辑模拟更精准，生数Vidu在动漫风格化等方面表现出色。

此外，API和本地部署问题也影响着视频生成模型的发展。中小型云服务商积极接入开源模型，但目前对视频生成模型API的调用缺乏普遍方案，本地部署在视频生成方面也面临诸多困难。

值得注意的是，AI视频创作正在逐渐下沉。根据数据，一些头部视频生成大模型的C端使用量大幅增长，随着通用AI客户端加入视频创作功能，更多下沉用户将接触到AI视频。一项技术并非要成熟才向下推广，AI视频生成虽有问题，但不影响普通人使用，未来生成式内容将塑造和改变世界。

# AI快讯

文章版权归作者所有，未经允许请勿转载。