从洗碗工到“AI教母”，她又预言了下一个十年

文章核心观点 - 人工智能领域的顶尖科学家李飞飞提出，AI发展的下一个关键方向是“空间智能”，她认为大语言模型受限于语言本身，而真正的智能机器需要理解物理世界的深度、距离、遮挡与重力等空间信息 [1] - 李飞飞创立的World Labs于2025年末发布了首款商用“世界模型”Marble，该公司在2024年成立后融资超过2.3亿美元，估值超过10亿美元 [2] - 李飞飞的职业生涯贯穿了AI从实验室到产业爆发的全过程，其推动建立的ImageNet数据集被视为结束了人工智能寒冬并开启了AI黄金时代的关键，如今她正致力于构建一个新时代的“ImageNet”以推动空间智能发展 [2][6][9][10] 李飞飞的个人背景与职业生涯 - 李飞飞16岁随父母移民美国，家境困顿，曾在餐馆打工时薪2美元，每天只睡4小时学习，最终以SAT 1250分、数学满分的成绩获得普林斯顿大学物理学全额奖学金 [3][4] - 她在加州理工学院攻读博士时，同时研究神经科学和计算科学，专注于让机器学会“看”的视觉研究领域 [5] - 其职业生涯经历了从学界到产业的转换，曾担任斯坦福人工智能实验室（SAIL）主任，并于2017年加入Google Cloud担任AI/ML首席科学家兼副总裁 [9] ImageNet的创立与行业影响 - 在2005-2009年的人工智能寒冬期间，李飞飞坚信数据是AI质变的关键，决心构建一个涵盖“全世界所有物体”的庞大图像数据库，即ImageNet [6] - 项目初期面临巨大困难，手动标注需90年，后借助亚马逊众包服务解决了海量图像标注的效率难题 [8] - 2009年，ImageNet论文亮相，数据库包含5247个类别、320万张标记图片 [8] - 2012年，AlexNet模型在ImageNet挑战赛中以领先第二名41%的优势夺冠，将Top-5错误率从26%降至15%，证明了优质数据预训练的重要性，该时刻被视为AI发展史上的“奇点”之一 [9] - 李飞飞免费开放ImageNet数据库，推动了深度学习闸门的打开，被誉为结束了AI寒冬并拉开了人工智能黄金时代的序幕 [9][10] 对AI发展趋势的判断与空间智能 - 李飞飞指出大语言模型（如ChatGPT）存在局限性，受制于语言本身，而“语言即世界”是一种偷换概念，信息不仅包括语言，还包括空间信息 [1][10] - 她认为AI的下一个十年是“空间智能”，若AI无法理解物体的深度、距离、遮挡与重力，就永远无法真正“具身” [1] - 其判断源于长期的跨学科研究，包括认知神经科学、计算机视觉以及对生物视觉起源的思考 [1][5] - 空间智能被视为实现通用人工智能（AGI）所需的多把钥匙之一，AGI的发展是一个渐进的过程 [12] World Labs与空间智能的研发进展 - 李飞飞于2024年创立World Labs，开始研发空间智能，并于2025年末发布了首款商用“世界模型”Marble [2][11] - 她承认生成三维空间在技术上存在挑战，目前仍处于早期阶段，但笃定未来一到两年内空间智能会爆发 [11] - 该公司的目标是构建一个能够理解并生成三维物理世界信息的模型，类似于为新时代打造一个“ImageNet” [10][11]