AI视频的主体一致性问题一直以来是个棘手的任务。虽然我们可以轻易让AI生成模特和服装,但如果要求特定人物如马斯克代言,并穿上特定款式的服装,AI面临的挑战就格外严峻。
[Pi](https://ai-kit.cn/sites/558.html)ka 2.0模型的创新方案
[Pika](https://ai-kit.cn/sites/403.html)最新发布的2.0模型提出了一种解决方案:用户上传多张图片,Pika将参考图片中的元素,精准生成视频。这种方法使得基础的广告片制作变得更加简便—只需集齐人物、商品、场景的照片即可。
广告行业的新挑战
这种技术是否意味着AI视频一致性的难题得到了解决,从而使广告行业的专业人员感到忧虑?实际情况并非如此,实测表明,Pika的可玩性确实很高,但实用性方面还有待加强。
「场景成分」功能的魔力
Pika的多图上传功能称为「Scene Ingredients」(场景成分)。使用起来非常直观:1.点击「+」上传图片,最多6张;2.在文本框内输入简单的提示词。以下是实际操作的一个例子 —— 让马斯克和奥特曼同框观看电影。
提供提示词:两个人坐在漆黑的观众席中……。使用者只需上传两位的照片,观众席的环境可以通过提示词来构建。
素材复用与人物换装的乐趣
Pika的一个有趣之处在于素材的「复用」。我们可以仅上传一张服装图片,然后用提示词让角色穿上同样的衣服,拍摄时尚大片。
对于扎克伯格,我们也进行了类似的尝试。我们先用AI工具生成了写有「I was human」的衣服,然后上传了扎克伯格的照片和一把尤克里里的图像,让他尝试音乐。
国产模型的比较与对比
与Google Veo、OpenAI [Sora](https://ai-kit.cn/sites/328.html)等相比,Pika的模型能力并不属于顶尖,解决了一个问题,又会不断出现新的问题。而国产AI视频模型Vidu比Pika更早实现了「多图参考」的功能,并提供了免费体验积分。
降低AI视频控制门槛
Pika在一定程度上提高了视频的可控性,尤其是在场景、服装、物品上的一致性保持较好,但在人物面部的处理上容易出错,不论何种次元。
AI视频的商业潜力与玩家社区
Pika的2.0模型发布后不久,海外网友已经开始疯狂玩转这项技术。用户可以通过AI一键试衣,节省实拍成本。
创意与趣味:AI视频市场的新机遇
虽然Pika在整活和创意方面表现出色,但其在模拟物理世界等长远目标上,还有很长的路要走。但让AI短视频变得有趣起来的小目标已经是一种成功。