LoRA

搜索文档
用微信聊天记录来做AI数字的你,开源了
36氪· 2025-05-16 15:19
WeClone项目概述 - 开源项目WeClone基于微信聊天记录生成数字分身,技术实现采用Python,支持阿里通义千问2.5模型,已获8.7k星标收藏 [1] - 项目通过RAG知识库原理导入微信聊天记录,结合LoRA微调方法及ASR/TTS技术实现声音克隆,默认使用Qwen2.5-7B-Instruct模型,需16GB显存 [2] 技术实现细节 - 数据预处理依赖PyWxDump工具提取微信聊天记录(不支持4.0版本),需将CSV格式聊天记录存放于./dataset/csv目录 [6] - 支持修改数字人对话场景名称及系统提示词,可设置为个性化身份而非机器人模式 [5] - 项目集成AstrBot实现与微信/企业微信/飞书的平台对接 [2] 应用场景扩展 - 客服场景:利用客服人员聊天记录自动构建话术库,降低知识整理成本并减少人员流动影响 [7] - 营销场景:通过销售聊天记录生成行业定制化数字分身,解决TO B/TO C客户培训差异化问题 [7] - 财务场景:基于财务专员聊天记录生成自动化应答数字人,处理常规财务咨询 [7] 数据价值分析 - 微信聊天记录被验证为最贴近个人特征的私密数据源,可分类不同生活/工作场景数据训练高精度数字分身 [3] - 企业场景中钉钉/企业微信的聊天记录可训练角色化数字人,准确率显著高于通用AI模型 [3][7] 社区生态 - 项目采用AGPL-3.0开源协议,当前版本v0.2.2,含6次版本发布,开发者社区活跃度指标:47人关注/675次分叉 [1][8]