Workflow
ImageNet
icon
搜索文档
李飞飞:高校学生应追逐AI“北极星”问题
虎嗅· 2025-07-08 16:15
从开洗衣店谋生、到因学术成就被誉为"AI 教母",再到如今成为一家企业的 CEO,李飞飞一直处在"从 零到一"的历程,并享受其中。用她自己的话来说: "我喜欢从零开始的感觉,就像站在原点一样。忘记你过去所做的一切,忘记别人对你的看法。只是埋 头苦干,努力构建。那是我的舒适区,我就是喜欢那样。" 日前,李飞飞在 Y Combinator 的 AI Startup School 活动上,回顾了 ImageNet 项目的诞生历程、她早期 对数据驱动方法的信念,以及卷积神经网络(CNN)等突破如何催生图像描述、故事生成,最终发展 出生成式模型。她还解释了为何 3D 世界建模对通用人工智能(AGI)至关重要,在她看来,"没有空间 智能,AGI 就是不完整的。" 另外在现场,李飞飞还给了身处 AI 时代的硕士、博士研究生一些建议: 学术头条在不改变原文大意的情况下,做了简单的编译。内容如下: 一、我的梦想是让机器"看见" Diana Hu:我们非常高兴能够邀请到李飞飞博士,她在 AI 领域具有很长的职业生涯,被誉为"AI 教 母"。飞飞,2009 年,也就是 16 年前,你最初创建的项目之一是 ImageNet,引用量已 ...
李飞飞最新对话
投资界· 2025-07-04 20:05
AGI最新判断。 作者 | 闻乐 不圆 来源 | 量子位 (ID:QbitAI) 在我看来,没有空间智能,通用人工智能就不完整。 这是"AI教母"李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想: 让智能体能够讲述世界的故事 。 而这,离不开 空间智能 。 正如她本人所说: 我整个职业生涯都在追逐那些极其困难、近乎疯狂的问题。 李飞飞如今聚焦于空间智能领域——这个人工智能最艰难的领域之一。 她认为 3D世界建模 对于实现AGI至关重要,并表示: 理解三维世界、生成三维世界、推理三维世界、在三维世界中做事,是人工智能的基本问题。 她的目标是创建一个超越平面像素、跨越语言障碍、能够真正捕捉三维世界结构和空间智能的 世界模型 。 在这次对话中,她从ImageNet的起源和影响说起,讲述了AI范式转变与关键突破,并提到了3D建模面临的挑战以及空间智能的数据 缺失问题。 量子位翻译并总结了全文,让我们一起来学习李飞飞的最新认知和分享。 ImageNet为现代计算机视觉搭建数据骨架 Q:你最早创建的项目之一是2009年的Image ...
李飞飞曝创业招人标准!总结AI 大牛学生经验,告诫博士们不要做堆算力项目
AI前线· 2025-07-03 16:26
AI发展瓶颈与空间智能 - 当前AI繁荣存在根本性局限,语言大模型无法理解物理世界的复杂性,空间智能是AGI缺失的关键拼图[1][11] - 视觉智能进化历时5.4亿年,远超语言能力的50万年进化周期,三维世界理解是AI根本问题[11] - World Labs聚焦空间智能连续谱,涵盖从生成到重建的全场景应用,包括元宇宙内容创作和机器人学习[16][17] ImageNet的历史突破 - ImageNet项目始于18年前,当时AI领域数据稀缺,计算机视觉算法几乎不可行[2] - 2009年开源数据集并发起ImageNet挑战赛,初始错误率30%,2012年AlexNet通过卷积神经网络和双GPU并联实现突破性进展[3][4][5] - 该突破标志着数据、GPU和神经网络首次联合发挥作用,被行业称为"AlexNet时刻"[5] 计算机视觉发展路径 - 从单一物体识别(ImageNet)到场景描述(2015年图像生成文字说明),再到三维世界建模的技术演进[7][8][9] - 生成式AI实现图像描述的反向过程,扩散模型使文本生成图像成为可能[8][9] - 视觉处理面临三维结构、投影病态问题和物理规律约束等核心挑战[14][15] World Labs技术方向 - 团队集结可区分渲染框架创建者、神经风格迁移专家和NeRF论文作者等顶尖人才[14] - 开发区别于LLMs的新型架构,解决三维空间组合爆炸问题,需构建结构性先验[16] - 应用场景覆盖3D艺术创作、工业设计、机器人学习和元宇宙内容生成[17][19] 行业生态与学术建议 - AI发展需要多元开源策略共存,Meta通过开源繁荣生态,部分公司依赖闭源创造营收[29][30] - 博士生应选择产业界难以解决的基础性问题,如跨学科AI、表示学习和小样本学习等方向[26][27] - 学术界在理论层面存在模型可解释性、因果关系等未解难题,具有突破潜力[27]
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 17:49
来源丨Web3天空之城( Web3SkyCity ) 著名AI科学家李飞飞 这一次在YC创业学院峰会的最新访谈深入探讨了她的职业生涯与前瞻思考。她 分享了创办ImageNet,这一引爆深度学习革命的关键项目的幕后故事,并阐述了计算机视觉从物体 识别到场景叙事,再到她当前所专注的"空间智能"的演进路径。 李飞飞认为,理解和交互于三维世界是实现通用人工智能不可或缺的一环,并为此创立了World Labs。访谈还触及了她的个人经历,从移民少年到创办洗衣店,再到成为顶尖学者和企业家的历程, 强调了"智识上的无畏"是推动创新和个人成长的核心动力。 核心观点 ImageNet的诞生与深度学习的黎明 李飞飞 : 我整个职业生涯都在追逐那些极其困难,近乎妄想的问题。对我来说,没有空间智能的AGI 是不完整的。我想解决这个问题。我就是喜欢当企业家。忘记你过去所做的一切。忘记别人对你的看 法。埋头苦干,努力建设。那是我的舒适区。 主持人 : 所以,我非常兴奋能邀请到李飞飞博士。她在人工智能领域有着非常长的职业生涯。 我相信你们很多人都认识她,对吧?请举手。我也认识。她被称为人工智能教母。飞飞你创建的第一 个项目之一是2009年的 ...
李飞飞最新访谈:没有空间智能,AGI就不完整
量子位· 2025-07-02 17:33
李飞飞对AGI与空间智能的核心观点 - 空间智能是通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29] - 3D世界建模是实现AGI的关键 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中做事 [7][29] - 目标是创建超越平面像素 跨越语言障碍 能够真正捕捉三维世界结构和空间智能的世界模型 [8][29] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 是智能发展的基础 [27] ImageNet项目的历史意义 - 2009年创建的ImageNet解决了AI领域的关键数据问题 为现代计算机视觉搭建了数据骨架 [11][13] - 项目构想源于机器学习需要范式转变 通过下载十亿张图片创建视觉分类体系来训练算法 [13][14] - 2012年AlexNet突破性进展 将卷积神经网络 GPU和深度学习首次结合 错误率从30%大幅下降 [15][17][19] - ImageNet开源策略和挑战赛机制推动了整个AI社区的发展 [15] 计算机视觉的发展历程 - 从物体识别(ImageNet)到场景描述(2015年图像字幕技术)再到3D世界建模的演进 [19][20][22][24] - 自然语言与视觉信号的融合让智能体能够讲述世界的故事 [22] - 生成式AI的发展使得从文字生成图像成为可能 展现了AI的惊人进步 [22] 空间智能的挑战与机遇 - 3D建模面临数据缺失问题 互联网缺乏空间智能数据 信息主要存在于人类大脑中 [9][33][49] - 3D世界比语言(一维)复杂得多 涉及物理规律 投射转换等多重数学难题 [30][31] - World Labs正在构建3D基础模型 应用场景包括设计 建筑 游戏开发和机器人等领域 [35] - 元宇宙是重要应用方向 需要硬件和软件的融合以及内容生成的世界模型 [35][36][37] 人才培养与团队建设 - 思想上的无畏精神是成功人士的核心特质 也是招聘的重要标准 [41][42] - World Labs正在招募工程 产品 3D和生成模型领域的人才 [43] - 跨学科AI和小数据领域是学术界值得关注的方向 [44][45] - 研究生阶段应被强烈好奇心引领 专注于解决根本性问题 [47][48]
AI自动化背后:凡是可量化的,皆不能幸免
36氪· 2025-06-24 09:41
AI对劳动力市场的冲击 - AI正在迅速冲击几乎所有劳动领域,包括创意工作、数据分析、金融分析、法律、医学等专业领域 [1][3] - 43%的AI交互已属于直接执行任务的自动化形式,而非协助思考 [5] - 自动驾驶可能取代数百万网约车、公交和卡车司机 [5] AI技术发展现状与争议 - OpenAI和Anthropic认为通用人工智能(AGI)可能1-2年内实现,而Meta专家认为当前模型缺乏物理世界理解和战略前瞻性 [3] - 2012年卷积神经网络突破终结AI寒冬,确立数据+指标+算力的成功模式 [8] - 当前AI模型仅在其训练数据范围内发挥作用 [3] 自动化影响评估框架 - 自动化风险取决于任务可量化程度,被法律/税法/合规协议规范化的环境最易被取代 [5] - 判断力曾被认为是人类最后优势领域,但AI正快速侵蚀这一领域 [5][6] - 测量成本降低使更多领域变得可量化,加速自动化进程 [9][11] 难以自动化的领域 - 涉及奈特不确定性的任务如创业、政策制定、艺术创作等难以量化 [15] - 隐私/伦理受限领域、要求透明推理的领域、人类偏好参与的领域发展滞后 [14] - 极端物理研究、地幔探索、活脑细胞研究等测量困难的科学领域 [14] 企业应对策略 - 领导者需识别易受自动化影响的业务环节,规划向智能价值链上游迁移 [4] - 应重视无法量化的技能如信任、品味、经验等无形因素 [16] - 支持ROI模糊的创新项目,鼓励团队探索未知,保留战略模糊性 [1][16] AI技术演进模式 - 成功AI系统需要三大要素:任务环境数据、明确奖励机制、充足计算能力 [9] - 合成数据生成和传感器普及正加速AI应用落地 [9] - 测量成本降低形成正反馈循环,使自动化范围持续扩大 [11][12] 人类独特优势 - 人类前额叶皮层支持开放式反事实规划,在不确定性中保持优势 [13] - AI将可预测任务常规化,释放人类脑力处理更高级问题 [13] - 创造性突破依赖设想全新反事实世界的能力 [15]
李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型
量子位· 2025-06-09 17:27
文章核心观点 - 李飞飞因角膜损伤暂时失去立体视觉的经历,促使她认识到空间智能对AI系统的重要性,并坚定了构建世界模型(LWM)的决心 [1][2][3] - 世界模型是AI发展的下一里程碑,其核心在于让AI获得类似生物的空间认知能力,真正理解三维物理世界 [15][23][24] - 当前AI系统在语言处理方面取得突破,但在空间智能方面仍存在明显不足,这是未来需要重点攻克的方向 [10][20][29] 构建能真正理解物理世界的AI模型 - 李飞飞早在大语言模型(LLM)兴起前就意识到构建世界模型的重要性,这与她的学术经历和生病经历有关 [6][7] - 她创建的ImageNet收录超过1000万张精确标注图片,彻底改变了计算机视觉和深度学习的研究格局 [8] - 数据驱动范式所爆发的能量远超李飞飞最初想象,但当前AI仍缺乏对物理世界的理解 [9][10] - 语言对三维物理世界的表征存在天然缺陷,真正的通用智能必须建立在对物理空间结构和物体组合关系的理解上 [12][14][15] 创立World Labs的契机 - 李飞飞与a16z合伙人Martin Casado在关于LLM的学术聚会上达成共识,认为世界模型是当前AI缺失的关键部分 [17][19][21] - Martin指出语言对物理空间的转译低效且失真,自动驾驶行业投入上千亿美元仍未能完美解决二维导航问题 [20] - 李飞飞表示世界模型才是智能的下一里程碑,一旦取得突破将创造无限虚拟宇宙,应用于建筑设计、材料合成等领域 [22][24] 技术突破与团队优势 - 实现世界模型需要集结产业级的算力、数据和人才密度,World Labs组建了全球顶尖的跨学科团队 [25][34][35] - 技术突破点在于让AI从单目视觉输入中重建完整三维场景理解,这是机器人精准抓取和虚拟宇宙生成的基础 [39][40] - World Labs团队在计算机视觉领域有深厚积累,包括神经辐射场(NeRF)技术和高斯泼溅表示法等创新成果 [31][32][33]
成就GPU奇迹的AlexNet,开源了
半导体行业观察· 2025-03-22 11:17
杰弗里·辛顿(Geoffrey Hinton)[上图] 和他的研究生亚历克斯·克里热夫斯基(Alex Krizhevsky)和伊利亚·苏茨克弗(Ilya Sutskever)于 2012 年发布了具有开创性的 AlexNet,一 种用于图像识别的神经网络。 计算机历史博物馆与Google合作,发布了AlexNet 的源代码。AlexNet 是一个神经网络,于 2012 年开启了当今流行的 AI 方法。该源代码可在CHM 的 GitHub 页面上以开源形式获取。 什么是 AlexNet? AlexNet 是一个人工神经网络,用于识别照片内容。它由当时的多伦多大学研究生Alex Krizhevsky和Ilya Sutskever以及他们的导师Geoffrey Hinton于 2012 年开发。 深度学习的起源 如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容来 自spectrum,谢谢 。 AlexNet 于 2012 年首次发布,引发了人工智能和计算机视觉领域的一场革命。 辛顿被认为是深度学习 之父之一,深度学习是一种使用神经网络的人工智能,也是当今主流人工 智能的基础。20 世纪 50 年代末,康奈尔大学 ...
李飞飞,带出一个学生军团
投资界· 2024-12-06 15:16
李飞飞门派。 作者 I 陈晓 报道 I 投资界PEdaily 这要从一笔融资说起。 投资界获悉,近日具身智能初创公司穹彻智能宣布完成数亿元人民币Pr e -A+轮融资,红 杉中国领投,老股东Pr os p e rit y7 Ve nt u r e s、小苗朗程及璞跃中国加注。至此,穹彻智能 成立一年内完成第三轮融资。 身后是两位来自上海交通大学的青年教授——王世全和卢策吾。当中卢策吾身上的标签很 多,但令人印象深刻的 一个 是:师从李飞飞。 李飞飞是谁?现年4 8岁,被誉为"AI教母",她是全球研究AI领域的标志性人物,长期主 导着斯坦福大学的人工智能学科研究。而她带出的学生军团,正成为全球AI界的中流砥 柱。 李飞飞学生,排队宣布融资 1 9 8 8年出生的王世全是汕头人,从小就是一名学霸。2 008年,他考入浙江大学竺可桢学 院工高班。期间,他对机器人自动化有着很大的兴趣,后来到斯坦福大学攻读博士学位, 在仿生与灵巧操作实验室及人工智能实验室,师从两位机器人领域的泰斗——Ma r k Cu t ko s k y教授和Ou ss ama Kha ti b教授。目前,他担任上海交通大学客座教授。 另一位联合创 ...