空间智能
搜索文档
星源智T5域控制器亮相百度大会 赋能智元精灵G2开启机器人新纪元
证券日报网· 2025-11-13 14:11
产品发布与性能 - 星源智公司在百度世界大会2025上展示了自主研发的机器人大小脑域控制器T5 [1] - T5域控制器集超大算力、低功耗与高性能于一体,搭载NVIDIA最新JetsonThor处理器,算力高达2070TFLOPS [1] - 该产品具备大型Transformer模型加速能力,广泛支持深度学习、计算机视觉等先进算法,可满足机器人在实时感知、智能决策与精准控制方面的需求 [1] 商业合作与应用 - 智元机器人与星源智公司已达成深度合作并联合参展 [1] - 搭载T5控制器的新一代工业级交互具身作业机器人智元精灵G2于今年10月份发布,并在展台同步亮相 [1] 公司背景与技术实力 - 星源智机器人公司由北京智源研究院孵化,致力于实现多模态空间智能,构建物理世界的通用具身大脑 [1] - 公司拥有世界领先的具身多模态大模型能力和空间智能能力,打造了内涵极为丰富的具身技术栈 [1] - 技术栈包括物理世界的多模态感知与数字化重建、多模态具身世界模型、机器人本体的运动控制、用于感知规划、决策、导航、操作的各类具身基础大模型、软硬一体的端侧具身系统等 [1]
李飞飞3D世界模型公测,网友已经玩疯了
量子位· 2025-11-13 13:38
产品发布与市场反响 - 李飞飞创立的World Lab公司发布全新3D世界生成模型Marble,并开启公测,人人可玩[1][3] - 该模型发布后迅速获得好评,用户使用简单,并在社交媒体引发刷屏现象[7][15] - 模型支持通过文本、照片甚至短视频轻松生成可编辑、可下载的专属3D世界,大幅降低使用门槛[4][35] 核心技术功能与特性 - Marble支持通过简短的文本提示、单图提示生成3D世界,并能通过多张图片、不同视角的图片拼接成统一世界[17] - 模型内置AI原生世界编辑工具,可进行局部编辑(如移除物体、修饰区域)或彻底编辑(如交换物体、改变视觉风格、重构大片区域)[21] - 对于专业用户,团队推出原生AI工具Chisel,可直接在3D中塑造Marble世界[23] - 模型支持对已生成世界进行扩展,为特定区域添加细节,并能将任意数量的世界组合起来构建更广阔空间[25][27] 输出格式与兼容性 - 创建的世界可选择两种方式导出:导出为高斯散点(最高保真度呈现形式)或导出为三角形网格(包含低保真碰撞器网格和高质量网格)[29] - 以网格形式导出能使3D世界与众多行业标准工具兼容,便于融入下游项目[29] - 3D世界可渲染成视频,导出后的视频可进行增强,添加细节、去除瑕疵并融入动态元素[31] 战略方向与行业定位 - 作为World Lab首款商业世界模型产品,Marble的核心在于多模态功能的深度落地,支持文本、图像、视频甚至粗略3D布局等多种输入方式[34][35] - 公司未来将重点发力交互性,目标是从静态创造发展到动态交互,实现与3D世界内元素的实时互动[36][37] - 该产品方向与李飞飞强调的空间智能是AI下一个前沿领域的观点一致,旨在打造具备生成、多模态处理和交互预测能力的真正空间智能世界模型[37]
“AI教母”李飞飞发布首款商用世界模型
第一财经· 2025-11-13 10:15
产品发布与特点 - World Labs公司正式推出首款产品Marble 由多模态世界模型提供支持 能通过单张图片 一段视频或一句文本提示创建高保真 持久的3D世界 [2] - Marble正式版功能扩展 支持大规模多模态输入 同步推出名为Marble Labs的创意中心 并开放免费增值与付费订阅服务 [5] - Marble提供四档订阅方案 免费版支持4次生成 标准版每月20美元 旗舰版每月95美元包含75次生成 [5] - Marble的差异化优势在于生成持久化 可下载的3D环境 显著减少场景变形与不一致性 支持导出为高斯泼溅 网格或视频格式 [5] 技术理念与行业定位 - 空间智能被定位为人工智能的下一个前沿 是机器实现真正智能的关键突破 [6] - 世界模型需具备生成性 多模态性和交互性三种核心能力 以构建环境内部表征 [8] - Marble是目前世界模型赛道中首个投入商用的产品 行业评测认为其交互效果不错但细节精细度需提升 [8] - 竞争对手如谷歌Genie处于有限研究预览阶段 Decart与Odyssey仅推出免费演示版本 [8] 应用前景与发展规划 - 短期内空间智能将赋能电影 游戏和建筑领域的创作者 快速生成可探索的3D环境 [8] - 中期将推动具身智能机器人发展 通过高仿真训练使其成为人类在家庭 实验室中的协作伙伴 [8] - 长远看空间智能有望在科学 医疗和教育领域引发革命 通过模拟实验 辅助诊断和沉浸式学习增强人类能力 [8] - 公司第一阶段专注于构建对三维性 物理性及空间和时间概念有深入理解的模型 随后将支持增强现实技术和机器人技术等领域 [9] 公司融资与市场地位 - World Labs在2024年创办 短短几月内完成约2.3亿美元(约合人民币16亿元)融资 估值迅速突破10亿美元(约合70亿元)成为AI领域最新独角兽企业 [9] - 公司投资方阵容包括a16z Radical Ventures 英伟达NVentures AMD Ventures和Intel Capital等科技与风投界重量级玩家 [9]
“AI教母”李飞飞发布首款商用世界模型 空间智能更近了
第一财经· 2025-11-13 09:37
公司产品发布 - 李飞飞创立的World Labs公司于11月13日正式推出首款产品Marble,这是一个由多模态世界模型支持、能通过单张图片、视频或文本提示创建高保真持久3D世界的平台 [1] - 产品正式版功能扩展,支持大规模多模态输入,同步推出名为Marble Labs的创意中心,并开放免费增值与付费订阅服务 [4] - Marble提供四档订阅方案,免费版支持4次生成,标准版每月20美元,旗舰版每月95美元包含75次生成并可解锁全部功能 [4] - 与实时模型RTFM的差异在于,Marble生成的是持久化、可下载的3D环境,支持导出为高斯泼溅、网格或视频格式,显著减少场景变形与不一致性 [4] 技术理念与行业定位 - 李飞飞认为空间智能是人工智能的下一个前沿,是机器实现真正智能的关键突破,其核心是构建具备生成性、多模态性和交互性的世界模型 [5] - 相较于谷歌Genie仍处于有限研究预览阶段,以及竞争对手Decart与Odyssey仅推出免费演示版本,Marble是世界模型赛道中首个投入商用的产品 [5] - 行业评测认为Marble整体交互效果不错,但细节精细程度还需要提升 [5] 市场应用前景 - 短期内空间智能将赋能电影、游戏和建筑等领域的创造力,提供快速生成可探索3D环境的工具 [5] - 中期将推动具身智能机器人发展,使其成为家庭和实验室中的协作伙伴 [6] - 长期有望在科学、医疗和教育领域引发革命,通过模拟实验、辅助诊断和沉浸式学习增强人类专业能力 [6] 公司融资与发展规划 - World Labs在2024年创办后短短几月内完成约2.3亿美元(约合人民币16亿元)融资,估值迅速突破10亿美元(约合70亿元),成为AI领域最新独角兽 [6] - 公司投资方包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家 [6] - 公司第一阶段专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实技术和机器人技术等领域 [6]
“AI教母”李飞飞发布首款商用世界模型,空间智能更近了
第一财经· 2025-11-13 09:31
产品发布与核心功能 - World Labs公司于11月13日正式推出首款产品Marble,该产品由多模态世界模型提供支持,被官方称为“构建空间智能未来的基础”[1] - Marble模型能通过单张图片、一段视频或一句文本提示创建高保真、持久的3D世界[1] - 与实时模型RTFM的差异化在于,Marble生成的是持久化、可下载的3D环境,显著减少场景变形与不一致性,并支持导出为高斯泼溅、网格或视频格式[4] - 产品正式发布时功能得到扩展,支持大规模多模态输入,并同步推出了名为Marble Labs的创意中心[4] 商业模式与定价 - Marble采用免费增值与付费订阅服务模式,免费版支持4次生成,仅限文本和图像输入[4] - 标准版订阅价格为每月20美元,支持多图、视频输入及高级编辑功能[4] - 旗舰版订阅价格为每月95美元,包含75次生成,可解锁全部功能[4] - Marble是世界模型赛道中首个投入商用的产品,而竞争对手如谷歌的Genie仍处于有限研究预览阶段,Decart与Odyssey仅推出免费演示版本[5] 技术理念与行业前景 - 公司创始人李飞飞认为,空间智能是人工智能的下一个前沿,是实现机器真正智能的关键突破[5] - 空间智能即人类用以理解、导航并与三维世界交互的底层能力,构建的世界模型需具备生成性、多模态性和交互性三种核心能力[5] - 短期内,空间智能将赋能电影、游戏和建筑领域的创造力,提供快速生成可探索3D环境的工具[5] - 中期将推动具身智能机器人发展,长远看有望在科学、医疗和教育领域引发革命[6] 公司发展与融资 - World Labs由李飞飞在2024年创办,并在短短几月内完成约2.3亿美元(约合人民币16亿元)的融资[6] - 公司估值迅速突破10亿美元(约合70亿元),成为AI领域最新的独角兽企业[6] - 公司投资方阵容包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家[6] - 公司第一阶段将专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实技术和机器人技术等领域[6]
锦秋基金被投企业流形空间3个月融资亿元,证明世界模型也需要预训练 |Jinqiu Spotlight
锦秋集· 2025-11-12 20:44
公司概况与融资动态 - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,专注于投资具有突破性技术和创新商业模式的通用人工智能初创企业[5] - 锦秋基金已完成对Manifold AI(流形空间)的投资[4] - 流形空间成立3个月便连获种子轮和天使轮两轮共亿元融资,成为世界模型领域的一匹黑马[6] 世界模型技术理念与优势 - 世界模型旨在打造一个能理解并预测物理世界的大脑,其核心是找到一种既简单又通用的方案[7] - 斯坦福大学教授李飞飞提出世界模型应具备三项核心能力:生成式、多模态、交互性[7] - 世界模型与VLA模型是具身智能领域的两种不同技术路径,世界模型通过将语言升维到视觉域,模拟所有场景,具备Dreaming想象能力[18] - 世界模型作为Agent Model可通过在线模拟和推演获得更优决策,作为Environment Model可通过离线强化学习使物理智能体获得更好泛化能力[20] - 世界模型让AI首次具备心智推演能力,能在脑中模拟因果、预判后果、优化行动,理论上能以更经济方式实现跨本体、跨场景的泛化[22] 世界模型技术路径与竞争格局 - 世界模型技术脉络可归纳为两大派系:显式物理建模和隐空间交互[25] - 显式物理建模代表包括Google Genie系列和斯坦福李飞飞创办的WorldLabs,后者采用Geometry Forcing方式引入显式物理信息[26][29] - 隐空间交互代表包括Google Dreamer系列和Meta的V-JEPA系列,后者通过采样与能量函数评估方式搜索最优执行状态[30][31] - 流形空间是全球唯一布局全域世界模型的团队,其技术路径为自下而上,先做领域模型并通过场景反馈数据不断完善模型能力[33] 流形空间技术策略与创新 - 流形空间选择从预训练开始做起,让模型真正学习物理世界的先验知识,理解因果规律,以降低后期部署成本和数据需求[35][37] - 在数据方面,流形空间采用70%互联网数据和30%真机采集,更倾向于使用第一人称视角数据和带有失败状态恢复的数据[39] - 在模型架构上,流形空间提出具身基座模型需具备推理、想象、执行三位一体的能力,并创新地在视频生成质量和动作质量间建立正相关[40] - 流形空间采用Auto-regressive+DiT混合建模的LongScape架构,其领域模型能方便地用MoE方式混合成更通用的基座模型[35] 商业化战略与市场选择 - 公司发展战略总结为“攀登高峰,沿途下蛋”,即瞄准通用具身世界模型基座的同时,将领域模型提前产品化和商业化以产生营收[42] - 在落地场景上,优先考虑机器人和无人机领域,但不考虑自动驾驶,因机器人市场更加碎片化,能容纳更多玩家[43][44] - 具体聚焦于让硬件本体拥有自主推理能力,推动机器人和无人机从人类控制阶段向智能化、自主推理方向发展[46][47] - 长期来看,世界模型产品化需轻量化,公司已将模型量化蒸馏部署到边缘端推理系统,并选择英伟达芯片,未来考虑国产芯片[47] 团队管理与未来规划 - 团队由工业界资深人士和天才00后组成,注重人才密度而非数量,管理上采用数据驱动的强化学习方式激励团队[49][51] - 计划在2025年底至2026年初正式发布第一代基于WMA路线的基座模型,融资节奏与产品研发节奏匹配[51] - 长期目标是推动Physical AI Agent向前一大步,并实现自研加上赋能的机器人数量超过市场总量的10%[51]
李飞飞揭大模型“死穴”:不会空间智能,再能聊也是纸上谈兵
36氪· 2025-11-12 19:47
当前AI的局限与空间智能的定义 - 当前人工智能被困在由文本和二维图像构成的“扁平世界”里,与立体的、受物理规律支配的现实世界严重脱节[1] - 空间智能被视为打破认知隔膜的关键,是AI从“对话工具”蜕变为“行动伙伴”的转折点,代表了人工智能演进的下一个前沿[1] - 当前AI在自主机器人发展、科学研究效率革命以及创意赋能方面缺乏深度理解,其根本原因在于缺乏人类与生俱来的空间智能[2] - 空间智能是人类通过“感知-行动”循环与物理世界互动的根本能力,驱动日常行为、非语言沟通、想象力与创造力,是文明重大突破的基石[4] 当前AI空间能力的不足 - 尽管多模态大型语言模型具备基础空间感知能力,最先进机器人能在受限环境中操控物体,但AI的空间能力仍远未达到人类水平[5] - 最先进的多模态大型语言模型在估算距离、方位、尺寸及“心理旋转”等任务上表现几乎与随机猜测无异,无法走出迷宫、识别捷径或预测基本物理规律[5] - AI生成的视频往往在几秒后失去连贯性,模型对世界的理解是表面与割裂的,缺乏人类整体性、关联性和基于直觉的认知[5] - 缺乏空间智能导致AI无法有效驾驶汽车、操控机器人、提供沉浸式互动体验,也无法加速材料科学与医学领域的探索进程[5] 下一代AI与世界模型的技术路径 - 构建具有空间智能的人工智能需要转向发展“世界模型”,其核心是能理解、推理并生成在语义、几何、物理和动态规则上都保持一致的复杂世界[8] - 世界模型需具备三种基本能力:生成式能力以创造感知、几何和物理动态一致的模拟世界;多模态能力以处理图像、视频、文本、动作;交互式能力以根据动作预测世界下一个状态[10] - 构建世界模型面临远超语言模型的挑战,因为“世界”遵循的规则更复杂,其表征的维度与复杂性远非一维序列信号可比[10] - World Labs致力于取得根本性进展,包括定义新的通用训练目标函数、破解大规模训练数据难题以及开发新的模型与表征架构[12] 空间智能的应用前景与产业影响 - 空间智能的应用将分阶段深化:短期赋能创意工具如World Labs的Marble平台,变革电影、游戏、建筑及工业设计等领域的故事讲述与空间叙事方式[15] - 中期而言,机器人技术是空间智能具身化的核心实践,世界模型通过生成高保真度模拟数据能极大扩展机器人学习的边界,实现可泛化的理解、推理与交互能力[15] - 长期看,空间智能将辐射至科学、医疗保健与教育等领域,模拟实验、辅助诊断、创造沉浸式学习体验,加速人类发现[18] - 空间智能将重构人机关系,使AI从依赖屏幕与文本的“工具”转变为能感知上下文、理解意图并主动协作的“场景伙伴”[20] 产业生态的演进与投资视角 - 高德地图董事长刘振飞指出,空间智能将如云计算一样,成为360行与物理世界交互的标配基础设施,推动AI从对话工具蜕变为行动伙伴[20] - 群核科技联合创始人黄晓煌将空间智能视为继大语言模型之后至关重要的新领域,是机器从自动化迈向“具身智能”的必经之路,并预言未来机器人数量可能达到700亿台[21] - 英诺创新空间创始合伙人邓永强提出“AI新大陆”概念,将空间智能提升至文明演进高度,预判2025年将成为相关技术规模化落地的关键元年[22] - 空间智能是涵盖三维环境感知与重建、定位与姿态估计、空间关系理解等复杂技术体系,其发展需要技术、伦理与商业的协同进化[24][25]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
量子位· 2025-11-12 16:01
罗福莉加入小米事件 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][7] - 该传闻始于2024年底,称雷军以千万年薪挖角DeepSeek核心开发者罗福莉 [4][10] - 2024年12月,小米AI团队论文作者栏已出现罗福莉名字,但当时身份为“独立研究者” [11] 罗福莉背景与影响力 - 罗福莉拥有北京师范大学计算机本科和北京大学计算语言学硕士背景,曾在阿里巴巴达摩院和DeepSeek任职 [15][17] - 其学术论文总引用次数超过11,000次,仅2024年一年内就新增约8,000次引用 [18] - 她参与了DeepSeek-V2等模型的研发,其名字也出现在DeepSeek最新的Nature封面论文中 [17][19] 小米的AI战略方向 - 在汽车业务步入正轨后,小米宣布将全力进军AI深水区 [9] - 2024年12月26日,媒体曝出小米正在组建GPU万卡集群 [6] - 雷军在跨年直播中公开披露了小米在AI方面的野心 [8] MiMo团队与空间智能技术 - 罗福莉领导的MiMo团队是小米推进大模型研发的核心招牌,目标指向空间智能 [23] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动的能力,是实现通用人工智能的关键一步 [3][23] - 该技术理念与小米拥有的“人、车、家全生态”场景天然适配 [25]
巴菲特宣告“谢幕”:年底卸任CEO,将加快捐赠速度|首席资讯日报
首席商业评论· 2025-11-12 13:15
巴菲特卸任与伯克希尔哈撒韦 - 首席执行官巴菲特将于今年年底卸任并退出公司日常管理 [2] - 公司将加快将遗产捐赠给子女基金会的步伐 [2] 软银集团财务业绩 - 第二季度销售净额1.92万亿日元,净利润2.50万亿日元,股息22日元 [3] - 上半年销售净额3.74万亿日元,净利润2.92万亿日元 [3] 胖东来诉讼案结果 - 四被告需停止侵权并删除涉诉视频,发布道歉声明 [4] - 被告方共同赔偿胖东来200万元,赔偿于东来40万元及合理开支20万元,合计260万元 [4] AMD战略收购 - 完成对美国AI推理创企MK1的收购 [5] - MK1团队将加入AMD AI事业部,整合软件创新与计算能力以推进AI软件栈 [5] 深圳市并购重组政策动向 - "香蜜湖金融+"并购培训大会有180多名代表参加,解读《深圳市推动并购重组高质量发展行动方案(2025—2027年)》 [6] - 监管部门专家剖析"并购六条"监管政策及案例,详解并购贷款制度安排 [6] 中国新能源汽车市场 - 10月份新能源汽车月度新车销量首次超过汽车新车总销量的50% [7] - 1至10月份新能源汽车产销量继续保持较高增长 [7] 北京市保障房建设进展 - 2025年第二批保障房计划包括新建项目17个房源1.98万套,筹集项目7个0.24万套,竣工项目7个0.81万套 [8] - 2025年计划建设筹集保租房5万套,竣工各类保障房8万套,截至10月底已全面完成 [8] AI技术前沿发展 - 李飞飞提出空间智能是AI下一个前沿,强调对物理世界理解是实现机器智能的关键 [9] 电影市场表现 - 《鬼灭之刃:无限城篇》预售总票房突破1.199亿,刷新中国影史进口动画电影预售票房纪录 [10] 汉堡王中国业务调整 - CPE源峰与汉堡王品牌成立合资企业"汉堡王中国",CPE源峰将注入3.5亿美元初始资金 [11] - CPE源峰将持有汉堡王中国约83%股权,RBI保留约17%股权,并签署20年中国独家品牌开发权 [11] 中国商用飞机进展 - 中国商飞C919飞机将首次在中东地区参加2025迪拜航展进行展示 [12] - 航展期间将有2架C919飞机和1架C909公务机亮相 [12] 中国工业机器人产业 - 2024年中国自主品牌工业机器人销量为17.7万台,"十四五"期间年均增速达33.1% [13] - 2024年自主品牌中国市场占比首次突破50%,达到58.5% [13]
李飞飞万字长文爆了!定义AI下一个十年
创业邦· 2025-11-12 11:08
文章核心观点 - 空间智能是人工智能的下一个前沿领域,其核心是构建能够理解、推理并与复杂物理世界互动的“世界模型” [8][16][26] - 世界模型需具备生成式、多模态和互动性三大核心能力,以解锁超越当前大语言模型的机器空间智能 [27][29][30] - 空间智能的应用将重塑创意产业、机器人技术和科学研究,其发展需要整个AI生态系统的集体努力 [38][44][48] 空间智能的定义与重要性 - 空间智能是人类认知的基石,使我们能够通过感知与行动的循环来理解和互动物理世界 [18][21] - 该能力驱动着从日常活动(如停车)到专业领域(如科学发现)的推理与规划 [18][21] - 当前AI在空间任务上表现不佳,例如估算距离或心理旋转物体,其能力远未达到人类水平 [22] 构建世界模型的技术框架 - 世界模型必须能生成遵循物理定律且在几何和动态上保持一致的世界 [27] - 模型需处理多模态输入,如图像、视频、文本指令和动作,并预测完整的世界状态 [29] - 当给定动作或目标时,模型应能输出与之协调的世界下一个状态 [30] - 技术挑战包括定义新的通用训练任务函数、利用互联网规模的数据以及开发新的模型架构 [32][33][34] 当前进展与案例 - World Labs已开发出名为Marble的平台,能通过多模态提示生成并维持一致的三维环境 [37][40] - 该平台展示了实时生成性帧基模型等创新架构,旨在实现高效生成和空间持久性 [35][37] 应用领域与前景 创意产业 - 空间智能将变革故事叙述和设计,使创作者能快速构建可探索的三维世界,不受预算或地理限制 [40][42] - 应用包括为电影、游戏、建筑和工业设计提供新的叙事维度和沉浸式体验 [42][43] 机器人技术 - 世界模型将通过模拟数据弥合训练差距,规模化机器人学习,以理解、导航和互动物理世界 [44] - 未来机器人可作为人类协作者,在实验室或家庭等场景中扩展劳动力,但需与人类目标对齐 [45] 科学、医疗与教育 - 在科学研究中,空间智能可模拟实验、测试假设并探索人类无法触及的环境 [48] - 医疗健康领域有望通过分子相互作用建模和医学影像分析加速药物发现与诊断 [48] - 教育将受益于沉浸式学习体验,使抽象概念触手可及,并支持安全的技能练习 [49]