AI项目和框架
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
探索MagicVideo-V2,AI视频生成技术新突破。
探索MagicVideo-V2,一款由字节跳动研发的先进AI视频生成系统。该系统结合了文本到图像技术、视频运动生成技术、帧插值技术等,提供高保真、流畅度极佳的视频...
阿里发布I2VGen-XL,一款先进的图像到视频生成模型。
I2VGen-XL是阿里巴巴研发的图像到视频生成技术,通过级联扩散实现高效文本与视频结构分离,支持转换高清视频,维持内容连贯,可通过Demo便捷体验。
阿里推出AI角色动画项目Motionshop,实现3D替换视频中人物。
探索Motionshop,这款阿里巴巴智能计算研究院推出的AI角色动画工具,特有功能包括3D化身转换、动作同步及虚拟与现实的融合。使其成为高效、创新的视频动画工...
探索阿里开源的AnyText:视觉图像文字生成与编辑模型
AnyText由阿里巴巴智能计算研究院研制,为多语言视觉文本生成及编辑模型,克服了传统文本生成的模糊、不准确问题。它支持包括中英文在内的多语言文本,并能处...
DiffusionGPT:开源文本转图像生成系统,大模型驱动,创新技术。
探索由字节跳动AI团队与中山大学联合开发的DiffusionGPT,一个前沿文本到图像生成技术,具备文本解析、模型筛选与集成、人类反馈优化和精细图像生成,为研究...
AI智能体协作框架 MetaGPT
MetaGPT为创新元编程框架,集大型语言模型与多智能体协作于一体,模仿人类解决难题。通过标准化工作流程SOPs转化为提示命令,提升效率降低错误。智能体承担产...
探索阿里开源的AI 3D数字人生成框架,Make-A-Character。
Make-A-Character是阿里巴巴集团开发的AI 3D数字人生成框架。它通过文本描述快速生产逼真3D模型,面向AI代理和元宇宙。特点包括多步骤生成流程,如文本解析到...
MotionCtrl:视频生成模型的运动控制器,由腾讯等开发。
MotionCtrl是一项由顶尖科研机构联合研发的先进视频生成技术,提供精细的相机运动和物体视角控制,创造出动态且吸引人的视频体验。本文详细介绍了MotionCtrl...
单目深度估计模型,由Tiktok等平台推出,用于提高视觉识别能力。
探索Depth Anything,一个由TikTok、香港大学和浙江大学研究人员开发的创新深度学习模型,专注于单目深度估计,具有高度鲁棒性和零样本学习能力。了解其工作...
AnimateDiff:扩展模型生成动画框架
AnimateDiff,由上海人工智能实验室、香港中文大学和斯坦福大学联合开发的动画生成器,能够通过文本描述控制动画内容和风格。它简化了模型调整过程,保持风格...