继一系列发布活动之后,[Sora](https://ai-kit.cn/sites/328.html)终于到达!
在12月10日,宣布了人工智能视频生成模型Sora的正式对用户开放,这距离首次公开预览已经过去了10个月。
时间并没有削弱Sora的热度,反而导致用户纷纷涌入,官方网站经历了巨大的流量冲击,以至于一度暂停注册和登录。
公告中提到,可以把Sora视为一份圣诞礼物。
提起定价,确实昂贵,4美元才能生成5秒1080P视频。
在两月前,有报道称尽管Sora被展示已经超过半年,但正式版本的延迟推出与其昂贵的视频生成成本直接相关。
有专家指出,早期版本的Sora需要巨大的计算资源,生产一分钟视频的时间高达约半小时,且需要多台机器并行处理,1分钟视频的成本可能超过100美元。
快速调整模型以提升成本效益,使其在特定任务上能够接近高级模型的性能,是技术团队的主要任务。
随着Sora正式发布,比最初亮相的版本有了显著提升,如今能通过文本直接生成最多20秒或高分辨率1080P的视频,成为全球生成时间最长的视频模型之一。这个模型支持文本加图片或视频的输入,并能编辑生成的视频,从而让效果更受控制。
在定价策略上,Sora Turbo对Plus和Pro用户是免费的,但是需要付出一定的月租费用,其中20美元的Plus用户每月可以生成最多50个480P分辨率的视频,而200美元的Pro用户可以生成500个视频,同时无限制生成普通视频,提供无水印下载选项。
积分制度的定价策略灵活多变,需要的积分根据分辨率和时间长度变动,已经是会员的用户无需额外费用。
例如,生成5秒480P视频需要25个积分,生成20秒视频则需要150个积分。此外,使用比如Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)等特殊功能,需要额外积分。
对于订阅用户来说,20美元的计划包括了1000积分,支持720p分辨率和5秒时长;200美元的计划包含10000积分,支持1080p分辨率和20秒视频,并能同时生成最多5个视频。
每积分成本为0.02美元,如果按此计算,Sora生成一个5秒480P视频的成本大约是0.5美元,而5秒1080p视频则是4美元。
虽然一部分用户认为价格偏高,但是这也是经过成本降低后的结果,还计划为不同的用户类型开发新的定价模式,并计划在年初推出。
Sora暂时不支持Team、Enterprise或Edu用户,也不对18岁以下用户开放。
目前Sora已经进入无限制使用阶段,有兴趣的用户现在可以体验。
根据体验者的反馈,Sora在视频一致性上有重大突破。正式上线后,许多视频创作者都急切尝试Sora。
一位专业视频博主在体验正式版Sora后表示,无论是用户体验还是视频修改和编辑的丰富性,Sora都非常优秀,动画效果流畅,故事板生成视频的一致性很完美。
核心功能包括Remix、Re-cut、Storyboard、Loop、Blend和Style presets。
特别地,Storyboard功能通过带有关键帧的时间轴,让创作者可以在个人时间轴上组织和编辑视频序列,提供了更大的创作灵活性。
Remix功能允许用户替换、删除或重新构想视频中的元素,提供了更大的自由度。例如,官网演示视频中,用户可以将设计的“打开大门通向图书馆”场景中的普通大门替换为法式对开门,将图书馆变为宇宙飞船,甚至是从宇宙飞船变为丛林,最后用月球景观替换丛林,创造了有创意且变化多端的视频。
Re-cut 功能允许用户从最佳帧中提取并向任意方向扩展,从而精细调整视频内容。Loop功能可以在视频的开始和结束添加额外帧,创建无缝的重复视频,达到平滑循环的效果。Blend允许融合两个完全不同的视频,创造和谐的过渡效果。Style presets允许用户选择或自定义风格,实现快速创作。
有体验者分享道,Sora正式版的丰富功能超乎他的想象,特别是Remix、Blend、Loop等功能让他大开眼界,而最令他印象深刻的是Storyboard功能。
之前在接受采访中提到,在商业AI视频制作中,画面一致性、分辨率和语义理解能力是展现视频质量的关键因素。
虽然文生视频技术为创意工作开拓了新领域,但局限性使其在商业应用中的价值远不及图生视频。因为短剧制作中需要保证人物形象和其他元素的一致性,而文生视频一般只能生成数秒内容,内容可能会突然变化,显然无法满足专业制作的要求。
发布正式版Sora之后,被体验者赞扬在不同提示下几乎可以生成完美一致性的视频分镜,组成流畅的电影,并Storyboard功能特别出色,通过时间轴中的分镜帧引导画面内容,确保镜头一致性,并支持精确控制镜头切换和多动作引导。
虽然Sora的表现超越了以前的文生视频工具,展现了更强大的功能,但图生视频的能力仍有不足。
国外的测评者也在试用一周后发现,Sora存在对物理规律理解不够好,经常出现异常情况,如手部动作不自然、文字错误、动物飞起来等。
顺便一提,还开发了全新的UI,并提供了社区分享服务,允许用户分享自己的视频,借鉴他人的提示效果来完善作品。
奥特曼在X(推特)上表示,与他人共同创作的便捷性让他感到兴奋,这感觉像是一个有趣的新事物。可以把Sora看作是视频版GPT-1。
随着Sora正式版的发布,文生视频领域又将再次面临翻天覆地的变化。
图片/