AI数字人技术

搜索文档
618全平台GMV突破21亿,交个朋友控股(01450)“AI+数字人”酝酿增长新动能
智通财经网· 2025-06-25 14:22
618大促业绩表现 - 公司618全平台GMV达21亿元 同比增长17.2% 订单量超600万单 场观人数突破7.5亿人次 [1] - 淘宝订单量同比增长65% 抖音增长42% 新入驻百度优选平台两场直播GMV突破1.05亿元 [1] - 数字人直播成为行业焦点 验证直播电商业务增长动能和AI技术战略价值 [1] 数字人直播技术突破 - 罗永浩数字人直播累计观看人次突破1300万 总GMV达5500万元 3C数码、食品饮料等品类表现超越5月真人直播数据 [2] - 核心技术架构包含五大模块:数字人多模协同技术、"剧本"生成技术、实时交互技术、语音合成技术、数字人长视频生成技术 [5] - 语音合成技术精准捕捉情绪变化 复现罗永浩标志性语言风格 数字人建模高度还原外貌、微表情和习惯性动作 [5] - 引入对话上下文解码器 实现打断、重复等逼真互动 形成高度拟真效果 [5] 行业竞争壁垒构建 - 建立"五轮选品机制"和类目专家培训 确保商品品质和专业服务 [6] - 618期间助力13个品牌实现千万级GMV突破 超400个品牌达成百万级GMV成就 [6] - 自主研发"朋友云"直播中台系统 支持超5000场直播 处理选品流程82万条 完成合规审核87万次 [6] - AI技术深入业务全链条 从口播稿编写到爆款趋势预测 提升用户体验和转化率 [6] 数字人直播优势与前景 - 数字人直播可实现24小时不间断运营 打破时间与成本限制 减少非黄金时段运营成本 [7] - 战略合作将落地24小时垂类直播间、跨境实时翻译直播等新场景 [7] - "真人+数字人"协同模式有望释放技术红利 带来业绩增量并推动行业价值重构 [7]
腾讯混元推出AI数字人技术:一张照片配音频即可生成唱歌视频
凤凰网· 2025-05-28 17:23
腾讯发布开源语音数字人模型HunyuanVideo-Avatar - 公司正式发布并开源语音数字人模型HunyuanVideo-Avatar 该技术仅需用户提供一张人物图像和一段音频文件即可自动生成包含自然表情、精准唇形同步以及全身动作的动态视频内容 [1] - 该模型基于腾讯混元视频大模型与MuseV技术深度融合开发 具备强大的多模态理解能力 能够自动识别输入图像中的人物环境信息以及音频所承载的情感内容 [1] - 模型突破了传统数字人技术仅支持头部驱动的局限性 全面支持头肩、半身与全身三种景别模式 同时覆盖多种艺术风格和多物种角色驱动 并具备双人或多人互动场景的处理能力 [1] 技术架构与应用场景 - 模型采用多模态扩散Transformer(MM-DiT)作为核心架构 通过角色图像注入模块确保视频中人物的一致性表现 音频情感模块能够从声音和图像中提取情感特征 [2] - 针对多人场景 模型配备面部感知音频适配器 利用人脸掩码技术实现多角色的独立精准驱动 [2] - 该模型已在腾讯音乐娱乐集团多个核心产品中实现落地应用 包括QQ音乐的AI虚拟形象同步演唱 酷狗音乐的AI虚拟人讲故事 以及全民K歌的用户专属MV生成功能 [2] 技术优势与开放计划 - 在主体一致性和音画同步准确度方面已达到业内领先水平 超越现有开源和闭源解决方案 在画面动态性和肢体自然度表现上与其他主流闭源方案处于同等技术水准 [2] - 单主体功能已在腾讯混元官方网站开放体验 用户可通过"模型广场-混元生视频-数字人-语音驱动"路径访问相关功能 当前支持不超过14秒的音频文件上传 [3] - 公司将逐步开源更多高级功能模块 此次开源举措将推动AI视频生成技术的普及应用 为短视频创作、电商营销、广告制作等垂直领域提供低成本的技术解决方案 [3]