Workflow
百度数字人技术
icon
搜索文档
连续三年获领先科技奖,百度数字人技术亮相2025世界互联网大会
扬子晚报网· 2025-11-06 18:20
公司技术成就 - 百度“剧本驱动多模协同的高拟真数字人技术”获得2025年世界互联网大会领先科技奖 [1] - 公司连续三年获得该奖项,是唯一连续三年获奖的人工智能公司 [1] - 公司自2016年以来已七次获得世界互联网大会领先科技奖 [2] 奖项与评审背景 - 2025年世界互联网大会领先科技奖共收到来自34个国家和地区的424项科技成果申报,最终评选出17项获奖成果 [1] 技术特点与创新 - 该技术包括融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成等创新 [1] - 技术突破多模态实时协同、复杂动态交互等技术难题,实现数字人语言、声音和形象的协调一致 [1] - 技术具有高情商、强互动、长续航、更专业的特色,效果超过真人 [1] 技术应用与成效 - 基于该技术已生产超过10万个数字人,应用于电商、教育、法律等行业 [2] - 技术帮助降低开播成本达80%,提升直播转化率31% [2] - 在百度优选罗永浩数字人首场直播中,数字人成功完成长达6小时超拟真直播,观播人数达1300万,GMV突破5500万 [2] - 技术已在百度电商场景的明星、图书和健康直播上落地应用,数字人可以24小时不间断直播 [2]
老罗数字人直播6小时背后,百度AI正在拉开差距
雷峰网· 2025-06-18 21:14
百度AI数字人直播电商创新 - 罗永浩数字人直播首秀26分钟GMV超真人1小时表现,整场GMV达5500万元,部分3C/食品品类单量超5月真人首秀同期数据,创数字人带货新纪录 [2][5] - 直播持续超6小时,生成近10万字讲解内容,吸引超1300万人次观看,验证数字人技术商业可行性 [5][7] - 数字人实现多模态协同:动作/表情/语调与话术完美统一,完成8300个动作,互动频次达真人直播3倍 [7][9] 多模协同数字人技术突破 - 技术架构包含剧本生成、动态决策交互、语音合成等5项创新,依托文心4.5 Turbo实现多模态规划与深度思考 [14][15] - 剧本生成技术同步输出动作/表情/语调标签,实现台词与多模态内容对齐,突破传统"照本宣科"模式 [15] - 语音合成采用字级别指令控制,结合对话上下文编码器解决双数字人互动难题,实现自然对话效果 [18] - 长视频生成技术保障6小时直播稳定性,数字人形象保持高一致性及拟真度 [18][19] 百度AI应用战略落地 - 公司聚焦垂直场景需求,以数字人/代码智能体/无人驾驶为切入点,差异化布局AI应用而非通用视频生成模型 [3][25] - 文心大模型4.5 Turbo成本仅为GPT的1%,X1 Turbo获信通院最高评级,计划2025年加速迭代并开源 [24] - 推出无代码工具"秒哒"降低开发门槛,代码辅助工具"文心快码"服务数百万开发者,萝卜快跑无人驾驶全球服务超1100万次 [26][27] 行业技术演进 - 数字人技术历经游戏动画、虚拟偶像阶段,AIGC突破后成本降低,现进入直播电商等商业化爆发期 [12] - 当前行业痛点包括内容模板化、交互生硬等问题,百度技术实现"人-物-场"自由交互,树立新标杆 [12][19]