商汤董事长兼CEO徐立:数据耗尽后,AI演进需与物理世界链接
AI演进路径与数据挑战 - AI发展经历了从感知智能到生成式智能的跨越,下一阶段突破依赖于对现实世界的主动探索与交互 [2] - 2011-2012年CNN、ResNet推动感知AI爆发,但依赖人工标注数据且泛化能力有限 [2] - 2017-2018年Transformer架构兴起,使AI能从自然语言中提取知识 [2] - GPT-3处理的文本量相当于人类十万年的创作积累,自然语言的高知识密度促成模型强大泛化能力 [2] 数据资源危机 - 当前自然语言数据可能在2027-2028年耗尽,视觉数据虽丰富但难以有效提炼知识 [2] - 自然语言数据产生速度远落后于算力增长速度,造成模型数据需求"倒挂" [3] AI未来发展方向 - AI进化需转向人类学习方式,通过与物理世界交互获得认知 [3] - 机器人及具身智能的瓶颈在于高质量交互数据采集的巨大需求 [3] - 真实环境交互成本高,传统模拟器方案存在"模拟与现实差距"问题 [3] - 视频生成模型可能产生违反物理规律的画面,如"幽灵穿越"或时空错乱 [3] 解决方案与技术突破 - 需要现实世界理解模型+深度3D理解模型协同提升交互能力 [3] - 商汤推出"开悟"世界模型,考虑时间空间一致性,可提供高质量模拟数据 [3] - AI发展将经历三个阶段:感知世界、理解并生成世界、与现实硬件交互改变世界 [3]