weclone:基于微信聊天记录打造精准数字分身

AI快讯1个月前发布 niko
7 0
AiPPT - 一键生成ppt

weclone项目近期走红,该项目能基于微信聊天记录生成数字分身,目前整个项目已开源,其技术采用python完成,且支持阿里同义千问2.5,现已收获8.7K收藏。

项目本质是RAG知识库的模型微调。利用RAG知识库原理,导入微信聊天记录,通过模型微调与LORA方式,最终微调出自己的数字人。项目自带ASR与TTS,可转化为用户自身声音。项目默认使用Qwen2.5-7B-Instruct模型,用LoRA方法对sft阶段微调,约需16GB显存。

微信聊天记录成最佳数字人记录。从个人数据角度看,微信聊天记录是极为私密且贴合个人的知识库,数据详细。我们常通过聊天记录判断他人性格。个人聊天记录可按不同场景分类,还能衍生出企业工作数字人,如钉钉或企业微信上的客服角色。基于聊天记录生成的数字人分身切实可行,有知识库及微调加持,较通用AI数字人准确率更高。

weclone支持修改数字人情景对话名称和系统提示词,设为个人模式。它支持用PyWxDump提取微信聊天记录(不支持4.0版本微信),可先将手机聊天记录迁移到电脑,导出为CSV格式,放入指定目录。

项目扩展性强。针对客服数字人,可降低企业成本,聊天记录本身就是知识库;针对营销数字人,销售聊天记录可作话术库,减少营销内容培训成本;还能作为财务数字人,处理财务常规问题。微信聊天记录可衍生多种数字人,就像推荐算法,数据足够时能成为MBTI助手,覆盖工作与生活。

© 版权声明
Trea - 国内首个原生AI IDE