可灵2.0：生成式视频新高度与多模态编辑新体验

AI快讯1年前 (2025)发布 niko

可灵AI引领生成式视频新潮流。在生成式视频领域，可灵AI早获全球用户认可。在Sora之前，可灵AI就以其出色表现崭露头角。无需复杂剪辑软件操作，短短几分钟，就能产出自然如实拍、画面质感似电影的动态视频。

版本迭代成就卓越性能。自去年6月6日首次上线开放测试，可灵稳坐国产AI视频头把交椅。历经二十多个版本迭代，可灵1.6模型图生视频内部评测效果比1.5模型提升近200%，毛绒玩具特效更是迅速走红。如今，可灵2.0视频生成和可图2.0文生图模型重磅推出。

更新亮点展现强大实力。此次更新亮点颇多。可灵、可图模型层面升级，快手自研技术让画面美学、语义响应和动态质量大幅提升，训练和推理策略强化对复杂内容的理解与表达。精准微调功能实用，可灵“多模态编辑”支持基于视频输入图片或文字进行精准修改创作，图片生成新增“图片编辑”及“风格转绘”功能。AI音效生成能根据影像和文字生成适配音效。

多模态编辑开启创作新篇 。可灵2.0新增“多模态编辑”功能，基于全新交互“语言”MVL（Multi-modal VisualLanguage）实现。MVL由TXT语义骨架和MMW多模态描述子构成，通过文本和动作描述文件生成精细视频。该功能有替换、增加和删除三种模式，在创意社区的应用展示了其强大创作能力。

全链路创作满足多元需求。“多模态编辑”满足影像从业者精细调优需求，可图2.0和可灵图生视频模式则造福大众。图生视频使用比例达85%，搭配视频模态微调可实现全流程创作。众多案例显示可灵2.0能还原多种经典画面，动作流畅自然。

技术理念推动产品进步。可灵2.0设计全新DiT架构，促进视觉与文本模态融合。预训练阶段精准建模训练，后训练阶段利用强化学习提升多模态推理能力。秉持“让灵感成真”理念，将用户体验置于中心，助力创作者轻松讲故事。

# AI快讯

文章版权归作者所有，未经允许请勿转载。