文章核心观点 - 人工智能领域的顶尖科学家李飞飞提出,AI发展的下一个关键方向是“空间智能”,她认为大语言模型受限于语言本身,而真正的智能机器需要理解物理世界的深度、距离、遮挡与重力等空间信息 [1] - 李飞飞创立的World Labs于2025年末发布了首款商用“世界模型”Marble,该公司在2024年成立后融资超过2.3亿美元,估值超过10亿美元 [2] - 李飞飞的职业生涯贯穿了AI从实验室到产业爆发的全过程,其推动建立的ImageNet数据集被视为结束了人工智能寒冬并开启了AI黄金时代的关键,如今她正致力于构建一个新时代的“ImageNet”以推动空间智能发展 [2][6][9][10] 李飞飞的个人背景与职业生涯 - 李飞飞16岁随父母移民美国,家境困顿,曾在餐馆打工时薪2美元,每天只睡4小时学习,最终以SAT 1250分、数学满分的成绩获得普林斯顿大学物理学全额奖学金 [3][4] - 她在加州理工学院攻读博士时,同时研究神经科学和计算科学,专注于让机器学会“看”的视觉研究领域 [5] - 其职业生涯经历了从学界到产业的转换,曾担任斯坦福人工智能实验室(SAIL)主任,并于2017年加入Google Cloud担任AI/ML首席科学家兼副总裁 [9] ImageNet的创立与行业影响 - 在2005-2009年的人工智能寒冬期间,李飞飞坚信数据是AI质变的关键,决心构建一个涵盖“全世界所有物体”的庞大图像数据库,即ImageNet [6] - 项目初期面临巨大困难,手动标注需90年,后借助亚马逊众包服务解决了海量图像标注的效率难题 [8] - 2009年,ImageNet论文亮相,数据库包含5247个类别、320万张标记图片 [8] - 2012年,AlexNet模型在ImageNet挑战赛中以领先第二名41%的优势夺冠,将Top-5错误率从26%降至15%,证明了优质数据预训练的重要性,该时刻被视为AI发展史上的“奇点”之一 [9] - 李飞飞免费开放ImageNet数据库,推动了深度学习闸门的打开,被誉为结束了AI寒冬并拉开了人工智能黄金时代的序幕 [9][10] 对AI发展趋势的判断与空间智能 - 李飞飞指出大语言模型(如ChatGPT)存在局限性,受制于语言本身,而“语言即世界”是一种偷换概念,信息不仅包括语言,还包括空间信息 [1][10] - 她认为AI的下一个十年是“空间智能”,若AI无法理解物体的深度、距离、遮挡与重力,就永远无法真正“具身” [1] - 其判断源于长期的跨学科研究,包括认知神经科学、计算机视觉以及对生物视觉起源的思考 [1][5] - 空间智能被视为实现通用人工智能(AGI)所需的多把钥匙之一,AGI的发展是一个渐进的过程 [12] World Labs与空间智能的研发进展 - 李飞飞于2024年创立World Labs,开始研发空间智能,并于2025年末发布了首款商用“世界模型”Marble [2][11] - 她承认生成三维空间在技术上存在挑战,目前仍处于早期阶段,但笃定未来一到两年内空间智能会爆发 [11] - 该公司的目标是构建一个能够理解并生成三维物理世界信息的模型,类似于为新时代打造一个“ImageNet” [10][11]
从洗碗工到“AI教母”,她又预言了下一个十年
36氪·2026-01-13 15:31