李飞飞最新YC现场访谈：从ImageNet到空间智能，追逐AI的北极星

ImageNet与深度学习革命 - ImageNet通过提供大规模高质量标记数据集(80000+次引用)为神经网络成功奠定基础开创数据驱动范式转变[8][9] - 项目历时18年孵化初期算法错误率达30% 直到2012年AlexNet结合GPU算力实现突破性进展[11][14][16] - 采用开源策略和挑战赛形式推动社区共建加速计算机视觉从物体识别向场景描述演进[12][17][19] 空间智能与World Labs布局 - 三维世界理解被定义为AI下一前沿进化史长达5.4亿年远超语言进化维度[24][25] - World Labs聚焦构建3D世界模型团队集结NERF作者等顶尖人才解决组合复杂度更高的空间智能问题[25][27][28] - 应用场景覆盖元宇宙内容生成机器人学习工业设计等需突破硬件与内容创作双重瓶颈[30][32] 人工智能发展路径 - 视觉智能发展轨迹清晰：物体识别→场景叙事→空间智能每阶段需5-10年技术积累[17][19][22] - 语言模型与视觉模型存在本质差异前者依赖序列数据后者需处理不适定的3D→2D投影问题[27][28] - AGI定义存在争议但空间智能被视为实现通用智能不可或缺的组成部分[23][44] 创新方法论 - "智识上的无畏"被反复强调为突破性创新的核心特质贯穿从学术研究到创业全过程[6][37][42] - 数据质量优先于数据规模需采用混合方法获取高质量3D空间数据[47][48] - 跨学科研究与小数据理论被视为学术界可突破的潜在方向[41][42] 行业生态观察 - 开源策略应根据商业模型差异化选择 Meta等平台型企业更倾向全面开源[46] - 学术机构在计算资源劣势下需聚焦工业界尚未关注的底层理论问题[41][42] - 硬件迭代与生成模型结合将推动元宇宙等场景落地[30][32]