可灵AI引领生成式视频新潮流。在生成式视频领域,可灵AI早获全球用户认可。在Sora之前,可灵AI就以其出色表现崭露头角。无需复杂剪辑软件操作,短短几分钟,就能产出自然如实拍、画面质感似电影的动态视频。
版本迭代成就卓越性能。自去年6月6日首次上线开放测试,可灵稳坐国产AI视频头把交椅。历经二十多个版本迭代,可灵1.6模型图生视频内部评测效果比1.5模型提升近200%,毛绒玩具特效更是迅速走红。如今,可灵2.0视频生成和可图2.0文生图模型重磅推出。
更新亮点展现强大实力。此次更新亮点颇多。可灵、可图模型层面升级,快手自研技术让画面美学、语义响应和动态质量大幅提升,训练和推理策略强化对复杂内容的理解与表达。精准微调功能实用,可灵“多模态编辑”支持基于视频输入图片或文字进行精准修改创作,图片生成新增“图片编辑”及“风格转绘”功能。AI音效生成能根据影像和文字生成适配音效。
多模态编辑开启创作新篇 。可灵2.0新增“多模态编辑”功能,基于全新交互“语言”MVL(Multi-modal VisualLanguage)实现。MVL由TXT语义骨架和MMW多模态描述子构成,通过文本和动作描述文件生成精细视频。该功能有替换、增加和删除三种模式,在创意社区的应用展示了其强大创作能力。
全链路创作满足多元需求。“多模态编辑”满足影像从业者精细调优需求,可图2.0和可灵图生视频模式则造福大众。图生视频使用比例达85%,搭配视频模态微调可实现全流程创作。众多案例显示可灵2.0能还原多种经典画面,动作流畅自然。
技术理念推动产品进步。可灵2.0设计全新DiT架构,促进视觉与文本模态融合。预训练阶段精准建模训练,后训练阶段利用强化学习提升多模态推理能力。秉持“让灵感成真”理念,将用户体验置于中心,助力创作者轻松讲故事。