百度集团副总裁平晓黎:数字人要到4.0阶段,更多场景实现“超越真人”
数字人技术演进与行业现状 - 数字人技术正经历快速迭代 目前行业主流处于2.0超拟真阶段 实现了高精度形象克隆、语言脚本与互动问答生成 [3][6] - 百度在数字人技术发展上处于行业引领地位 去年率先发布高说服力数字人 将行业带入3.0阶段 最近又发布了行业首个实时互动型数字人 [3][6] 数字人技术发展阶段与特征 - 1.0时代数字人仅有虚拟人效果 存在表情僵硬、机械音重等明显缺陷 [3][6] - 2.0超拟真数字人阶段 借助大模型实现了对人物形象的高精度克隆 支持大动作并摆脱纸片人效果 [3][6] - 3.0阶段高说服力数字人实现了形神音容高度协调 具备思考决策能力 并能调度多智能体完成任务 [3][6] - 即将到来的4.0阶段数字人将拥有世界模型与世界知识 实现持续自主进化与个性化情感互动 目标是在更多应用场景超越真人 [1][3][4][6] 数字人的核心驱动力与应用潜力 - 视觉模型、大语言模型及智能体相关技术的持续突破是数字人进化的基石 [1][4] - 数字人具备成为AI时代新交互方式的巨大潜力 实时互动型数字人能够感知理解物理世界 进行自然交互并提供情绪价值 [3][6] - 4.0阶段的数字人如同不知疲倦的数字永动机 将带来更大的生产力 [3][6]