3DV-TON：革新虚拟试穿，开启动态视频新体验

AI快讯1年前 (2025)发布 niko

3DV-TON技术问世 ：一项名为3DV-TON（Textured 3D-Guided Consistent Video Try-on viaDiffusion Models）的开创性技术亮相。它借助扩散模型，提供了具有纹理的3D引导式视频试穿体验。

核心功能突出 ：3DV-TON融合3D建模与视频生成技术，解决了传统虚拟试穿系统的动态不一致和纹理失真问题。其具备3D纹理引导功能，基于高分辨率3D人体模型生成服装纹理；能保证视频一致性，利用视频扩散模型维持多帧画面中服装的时空连贯性；拥有高保真视觉效果，支持4K分辨率输出；具备多场景适配能力，可从单张服装图片生成动态试穿视频；还提供用户友好界面，通过APi和可视化工具，让开发者和设计师快速生成试穿视频。

技术架构独特 ：该技术基于多模态扩散模型和3D建模技术，结合开源框架与高性能计算。包括采用SMPL -X等参数化模型进行3D人体建模，以视频扩散模型驱动生成纹理一致的视频帧，运用双流条件网络分离生成服装几何和纹理，引入多任务注意力机制增强跨帧几何一致性，且部分代码和预训练模型开源，具有可扩展性。

应用场景广泛 ：3DV-TON在多个领域展现出巨大潜力。在电商领域，为Shopify和Amazon等平台生成动态服装试穿视频；在虚拟时尚和元宇宙中，支持VR/AR换装体验；在影视动画里，为数字角色生成逼真服装动画；可实现个性化定制，根据用户上传数据生成个性化试穿视频；还能用于社交媒体营销，生成有吸引力的试穿内容。

快速部署开发 ：3DV-TON部分实现已在GitHub开源，用户需Python3.8+、PyTorch和Diffusers库。通过访问GitHub仓库、准备输入数据、配置参数、运行扩散模型、预览结果等步骤，可快速上手，还能导出4K视频。

社区反馈与展望 ：社区对3DV-TON的高保真视频生成和3D一致性高度评价，但指出复杂服装生成速度慢的问题。开发团队表示后续版本将优化推理效率，探索实时渲染。未来，3DV-TON可能与其他平台集成，构建闭环生态系统，甚至推出云SaaS服务。项目地址为https://HuggingFace.co/papers/2504.17414。

# AI快讯

文章版权归作者所有，未经允许请勿转载。