Spatial Intelligence

搜索文档
李飞飞:高校学生应追逐AI“北极星”问题
虎嗅· 2025-07-08 16:15
从开洗衣店谋生、到因学术成就被誉为"AI 教母",再到如今成为一家企业的 CEO,李飞飞一直处在"从 零到一"的历程,并享受其中。用她自己的话来说: "我喜欢从零开始的感觉,就像站在原点一样。忘记你过去所做的一切,忘记别人对你的看法。只是埋 头苦干,努力构建。那是我的舒适区,我就是喜欢那样。" 日前,李飞飞在 Y Combinator 的 AI Startup School 活动上,回顾了 ImageNet 项目的诞生历程、她早期 对数据驱动方法的信念,以及卷积神经网络(CNN)等突破如何催生图像描述、故事生成,最终发展 出生成式模型。她还解释了为何 3D 世界建模对通用人工智能(AGI)至关重要,在她看来,"没有空间 智能,AGI 就是不完整的。" 另外在现场,李飞飞还给了身处 AI 时代的硕士、博士研究生一些建议: 学术头条在不改变原文大意的情况下,做了简单的编译。内容如下: 一、我的梦想是让机器"看见" Diana Hu:我们非常高兴能够邀请到李飞飞博士,她在 AI 领域具有很长的职业生涯,被誉为"AI 教 母"。飞飞,2009 年,也就是 16 年前,你最初创建的项目之一是 ImageNet,引用量已 ...
李飞飞最新对话
投资界· 2025-07-04 20:05
李飞飞对AGI与空间智能的核心观点 - 空间智能是实现通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29][33] - 3D世界建模是人工智能领域最基础且最具挑战性的问题之一 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中行动 [7][8][33] - 创建超越平面像素 跨越语言障碍 真正捕捉三维世界结构和空间智能的世界模型是当前AI研究的终极目标之一 [9][33] ImageNet项目的历史意义 - ImageNet项目始于2007年 旨在通过互联网下载十亿张图片并创建视觉分类体系 为机器学习提供数据基础 [17][18] - 该项目包含14,197,122张图片和21,841个synsets索引 为计算机视觉研究建立了标准化数据集 [20] - 2012年AlexNet在ImageNet挑战赛中取得突破性进展 识别错误率从30%大幅下降 标志着数据 GPU和神经网络首次成功结合 [22][23][24] 计算机视觉的发展历程 - 从物体识别(如ImageNet解决的"识别猫或椅子")发展到场景描述 再扩展到三维世界理解 是计算机视觉研究的自然演进 [25][26][30] - 2015年左右 图像字幕生成技术取得重大突破 为后来的生成式AI发展奠定了基础 [27] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 这解释了为什么空间智能研究更具挑战性 [32][33] 空间智能研究的挑战 - 空间智能面临数据严重缺失的问题 与语言数据不同 三维世界的信息主要存在于人类大脑中 难以直接获取 [36] - 3D建模的数学复杂度远高于一维语言处理 需要将2D投影反向推导为3D结构 并遵守物理规律 [34][35] - 人类视觉皮层处理数据的神经元数量远超语言处理区域 这暗示了空间智能模型的架构可能需要与LLMs完全不同 [37][38] World Labs的研究方向 - 公司专注于解决空间智能这一AI领域最困难的问题 正在构建能够输出3D世界的基础模型 [31][40][41] - 研究团队由多位顶尖专家组成 包括Pulsar创造者 Justin Johnson和Nerf作者等 [34] - 应用场景涵盖设计 建筑 游戏开发 机器人学习以及元宇宙内容生成等多个领域 [41][42][44] 行业研究方法论 - 数据驱动方法需要与高质量数据并重 避免"输入垃圾输出垃圾"的问题 [73] - 鼓励跨学科研究 特别是在科学发现领域与AI的结合 [60] - 小数据研究和理论突破是学术界在资源受限情况下的重要方向 [61][62]
李飞飞曝创业招人标准!总结AI 大牛学生经验,告诫博士们不要做堆算力项目
AI前线· 2025-07-03 16:26
AI发展瓶颈与空间智能 - 当前AI繁荣存在根本性局限,语言大模型无法理解物理世界的复杂性,空间智能是AGI缺失的关键拼图[1][11] - 视觉智能进化历时5.4亿年,远超语言能力的50万年进化周期,三维世界理解是AI根本问题[11] - World Labs聚焦空间智能连续谱,涵盖从生成到重建的全场景应用,包括元宇宙内容创作和机器人学习[16][17] ImageNet的历史突破 - ImageNet项目始于18年前,当时AI领域数据稀缺,计算机视觉算法几乎不可行[2] - 2009年开源数据集并发起ImageNet挑战赛,初始错误率30%,2012年AlexNet通过卷积神经网络和双GPU并联实现突破性进展[3][4][5] - 该突破标志着数据、GPU和神经网络首次联合发挥作用,被行业称为"AlexNet时刻"[5] 计算机视觉发展路径 - 从单一物体识别(ImageNet)到场景描述(2015年图像生成文字说明),再到三维世界建模的技术演进[7][8][9] - 生成式AI实现图像描述的反向过程,扩散模型使文本生成图像成为可能[8][9] - 视觉处理面临三维结构、投影病态问题和物理规律约束等核心挑战[14][15] World Labs技术方向 - 团队集结可区分渲染框架创建者、神经风格迁移专家和NeRF论文作者等顶尖人才[14] - 开发区别于LLMs的新型架构,解决三维空间组合爆炸问题,需构建结构性先验[16] - 应用场景覆盖3D艺术创作、工业设计、机器人学习和元宇宙内容生成[17][19] 行业生态与学术建议 - AI发展需要多元开源策略共存,Meta通过开源繁荣生态,部分公司依赖闭源创造营收[29][30] - 博士生应选择产业界难以解决的基础性问题,如跨学科AI、表示学习和小样本学习等方向[26][27] - 学术界在理论层面存在模型可解释性、因果关系等未解难题,具有突破潜力[27]
李飞飞最新访谈:没有空间智能,AGI就不完整
量子位· 2025-07-02 17:33
李飞飞对AGI与空间智能的核心观点 - 空间智能是通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29] - 3D世界建模是实现AGI的关键 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中做事 [7][29] - 目标是创建超越平面像素 跨越语言障碍 能够真正捕捉三维世界结构和空间智能的世界模型 [8][29] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 是智能发展的基础 [27] ImageNet项目的历史意义 - 2009年创建的ImageNet解决了AI领域的关键数据问题 为现代计算机视觉搭建了数据骨架 [11][13] - 项目构想源于机器学习需要范式转变 通过下载十亿张图片创建视觉分类体系来训练算法 [13][14] - 2012年AlexNet突破性进展 将卷积神经网络 GPU和深度学习首次结合 错误率从30%大幅下降 [15][17][19] - ImageNet开源策略和挑战赛机制推动了整个AI社区的发展 [15] 计算机视觉的发展历程 - 从物体识别(ImageNet)到场景描述(2015年图像字幕技术)再到3D世界建模的演进 [19][20][22][24] - 自然语言与视觉信号的融合让智能体能够讲述世界的故事 [22] - 生成式AI的发展使得从文字生成图像成为可能 展现了AI的惊人进步 [22] 空间智能的挑战与机遇 - 3D建模面临数据缺失问题 互联网缺乏空间智能数据 信息主要存在于人类大脑中 [9][33][49] - 3D世界比语言(一维)复杂得多 涉及物理规律 投射转换等多重数学难题 [30][31] - World Labs正在构建3D基础模型 应用场景包括设计 建筑 游戏开发和机器人等领域 [35] - 元宇宙是重要应用方向 需要硬件和软件的融合以及内容生成的世界模型 [35][36][37] 人才培养与团队建设 - 思想上的无畏精神是成功人士的核心特质 也是招聘的重要标准 [41][42] - World Labs正在招募工程 产品 3D和生成模型领域的人才 [43] - 跨学科AI和小数据领域是学术界值得关注的方向 [44][45] - 研究生阶段应被强烈好奇心引领 专注于解决根本性问题 [47][48]
Intermap Technologies Announces Voting Results of the Annual General Meeting of Shareholders
Globenewswire· 2025-06-27 06:06
文章核心观点 2025年6月26日Intermap Technologies Corporation举行年度股东大会,股东对所有业务事项投票赞成,包括选举董事和任命审计师 [1][2] 股东大会情况 - 2025年6月26日公司在加拿大艾伯塔省卡尔加里举行年度股东大会 [1] - 共27,270,817股A类普通股出席会议,占已发行普通股总数的45.93% [1] 投票结果 董事选举 | 被提名人 | 结果 | 赞成票数 | 反对票数 | 赞成比例 | 反对比例 | | --- | --- | --- | --- | --- | --- | | Patrick A. Blott | 当选 | 18,579,224 | 698,190 | 96.38% | 3.62% | | Philippe Frappier | 当选 | 18,696,326 | 581,088 | 96.99% | 3.01% | | John (Jack) Hild | 当选 | 18,694,826 | 582,588 | 96.98% | 3.02% | | Jordan Tongalson | 当选 | 18,696,326 | 581,088 | 96.99% | 3.01% | [3] 审计师任命 - 任命MNP LLP为公司审计师至下一次年度股东大会,赞成票26,566,313,占97.42%;反对票704,504,占2.58% [3] 公司简介 - 公司1997年成立,总部位于美国科罗拉多州丹佛市,是地理空间情报解决方案全球领导者 [4] - 专注创建和分析3D地形数据以生成高分辨率专题模型,提供多源数据集,助力客户将地理空间情报融入工作流程 [4] - 产品和解决方案应用于国防、航空、保险、灾害缓解等多个领域 [4] 联系方式 - 执行副总裁兼首席财务官Jennifer Bakken,邮箱CFO@intermap.com,电话+1 (303) 708-0955 [5] - 投资者关系Sean Peasgood,邮箱Sean@SophicCapital.com,电话+1 (647) 260-9266 [6]
Satellogic Poised to Deliver Its NextGen Satellite and Technology Transfer for Malaysia's Earth Observation Satellite Program
Globenewswire· 2025-06-18 21:00
NEW YORK, June 18, 2025 (GLOBE NEWSWIRE) -- Satellogic, Inc. (NASDAQ: SATL), a leader in satellite manufacturing and high-resolution Earth observation data, is pleased to announce that Uzma Berhad, and by extension Satellogic as Uzma’s Technology Partner, has been selected as the successful bidder to lead the Malaysian High-Resolution Earth Observation Satellite Project (MHREOSP) for the Government of Malaysia. As a technology partner, Satellogic will design, develop, assemble, integrate and test a stat ...
Intermap Announces First Quarter 2025 Results
Globenewswire· 2025-05-16 04:01
文章核心观点 - 全球3D地理空间服务和情报解决方案领导者Intermap公布2025年第一季度财报并确认2025年业绩指引 公司在政府和商业领域均表现强劲 有良好发展态势和增长潜力 [1][3] 第一季度业绩 - 总营收430万美元 高于2024年第一季度的170万美元 [7] - 收购服务收入240万美元 高于去年同期的47.8万美元 [7] - 增值数据收入51.4万美元 高于去年同期的26.6万美元 [7] - 软件和解决方案收入130万美元 高于2024年第一季度的94.2万美元 [7] - 调整后息税折旧及摊销前利润(EBITDA)利润率为28% 高于2024年第一季度的25% [7] - 调整后净利润83.3万美元 而2024年第一季度净亏损83.9万美元 [7] - 总资产1920万美元 高于2024年12月31日的1190万美元 [7] - 现金、未开票收入和应收账款总计1390万美元 高于2024年12月31日的650万美元 [7] 政府业务里程碑 - 由CACI领导的团队被选为国家地理空间情报局2亿美元Luno B IDIQ合同的供应商 加上之前宣布的Luno A合同 可寻址机会总计达5亿美元 首份任务订单已开始下达 [3] - 继续执行印度尼西亚国家测绘计划第一阶段 交付的高分辨率3D高程和特征数据超规格且用时短 正争取6.53亿美元ILASP项目第二阶段后续合同 [4] - 在印度尼西亚测绘项目中产生许可、货币调整和营运资金投资费用 相关费用已在2025年4月收回 还产生了与即将签订合同有关的追踪成本 加回相关费用后 第一季度调整后EBITDA和收益分别为120万美元和83.3万美元 [5] - 在竞争中入选美国国防高级研究项目(DARPA)新项目 该项目将利用公司独特商业能力等资源 并可获得额外政府资助技术和研发支持 [6] 商业业务成果 - 保险业务表现出色 新签和续签合同超110万美元 与欧洲银行保险集团和PREMIUM Insurance签署两份多年合作协议 采用公司Aquarius RMA平台 [9] - 与全球主要太空基础设施运营商的合作显著扩大 该运营商增加对公司高精度3D高程数据投资 用于射频干扰建模和选址优化 2024年项目数量是前一年的10倍 收入增长6.4倍 2025年初项目规模近2024年平均规模的3倍 [10] - 与GPS高尔夫技术领先供应商续签订阅合作协议 进入第四年 利用公司高分辨率3D高程数据为全球超4万座高尔夫球场制图 推动数字高尔夫体验发展 因用户增长合作将扩展至新一代高尔夫产品 [11] 融资情况 - 2月筹集1200万加元 增强执行合同和扩大业务能力 [12] 展望 - 确认2025年预计营收3000 - 3500万美元 EBITDA利润率28% [13] - 不提供季度指引 公司产能大 客户多为大型机构和政府 有提高运营效率和执行速度的能力 [14] - 将继续构建经常性收入 推动客户全球范围内按需使用地理空间数据产品 深入目标市场并开拓新用户和用例 [15] 财务报告 - 2025年3月31日季度合并财务报表、管理层讨论与分析及相关认证将于5月15日在SEDAR+和SEC的EDGAR网站提交 [16] 电话会议 - 公司CEO和CFO将于美国东部时间5月15日下午5点主持网络直播 回顾业绩、提供公司最新情况并回答投资者问题 [18]