Workflow
老罗数字人直播6小时背后,百度AI正在拉开差距
雷峰网·2025-06-18 21:14

百度AI数字人直播电商创新 - 罗永浩数字人直播首秀26分钟GMV超真人1小时表现,整场GMV达5500万元,部分3C/食品品类单量超5月真人首秀同期数据,创数字人带货新纪录 [2][5] - 直播持续超6小时,生成近10万字讲解内容,吸引超1300万人次观看,验证数字人技术商业可行性 [5][7] - 数字人实现多模态协同:动作/表情/语调与话术完美统一,完成8300个动作,互动频次达真人直播3倍 [7][9] 多模协同数字人技术突破 - 技术架构包含剧本生成、动态决策交互、语音合成等5项创新,依托文心4.5 Turbo实现多模态规划与深度思考 [14][15] - 剧本生成技术同步输出动作/表情/语调标签,实现台词与多模态内容对齐,突破传统"照本宣科"模式 [15] - 语音合成采用字级别指令控制,结合对话上下文编码器解决双数字人互动难题,实现自然对话效果 [18] - 长视频生成技术保障6小时直播稳定性,数字人形象保持高一致性及拟真度 [18][19] 百度AI应用战略落地 - 公司聚焦垂直场景需求,以数字人/代码智能体/无人驾驶为切入点,差异化布局AI应用而非通用视频生成模型 [3][25] - 文心大模型4.5 Turbo成本仅为GPT的1%,X1 Turbo获信通院最高评级,计划2025年加速迭代并开源 [24] - 推出无代码工具"秒哒"降低开发门槛,代码辅助工具"文心快码"服务数百万开发者,萝卜快跑无人驾驶全球服务超1100万次 [26][27] 行业技术演进 - 数字人技术历经游戏动画、虚拟偶像阶段,AIGC突破后成本降低,现进入直播电商等商业化爆发期 [12] - 当前行业痛点包括内容模板化、交互生硬等问题,百度技术实现"人-物-场"自由交互,树立新标杆 [12][19]