Workflow
具身智能(embodied AI)
icon
搜索文档
深度|AI教母李飞飞:在AI时代,信任绝不能外包给机器,它本质上属于人类,存在于个体、社区与社会层面
Z Potentials· 2025-12-12 12:15
文章核心观点 - 人工智能的下一阶段是发展空间智能与世界建模能力,这将超越当前以语言为核心的大型语言模型,实现对物理和虚拟世界的深刻理解、表征与互动,从而开启全新的创造、推理与应用范式 [4][5][7] 空间智能与世界建模的定义与重要性 - 空间智能是对层次丰富、复杂空间世界的深刻理解,是具身智能(如机器人)的“大脑”,它完善了感知-行动的闭环并提升认知能力 [6][11] - 世界建模不仅包含语言,还涵盖视觉、光线、语义、空间以及物理动作,是对世界状态变化的表达、表征和亲身参与 [7] - 感知在进化上是主动的,其根本目的是为了行动与互动,感知智能构成了所有运动的基石 [11] - 许多人类文明的关键里程碑,如金字塔建造和DNA双螺旋结构的发现,都依赖于深度的空间推理与世界建模,而无法仅靠语言完成 [12] 应用前景与影响 - 世界建模能力将带来前所未有的创造自由,允许生成可置身其间、可互动的完整世界,应用场景涵盖娱乐、叙事、设计、工业、医疗健康及教育等领域 [8] - 机器凭借世界建模生成沉浸式体验的能力极其强大,并自然延伸至仿真,这对人类体验、学习以及具身AI的训练至关重要 [9] - 为AI系统引入空间智能后,将涌现新的推理特征,其价值不仅在于让机器人完成简单任务,更在于整体提升人类能力,协同开拓全新的认知与创造空间 [12] - 自动驾驶汽车作为在二维平面移动的“方盒子”,实现自动驾驶花了二十多年,而作为三维、核心任务是“正确触碰”的机器人,其技术发展之路还很长 [14] 人工智能的产业地位与信任 - AI是一项文明级技术,是新的计算范式,只要有芯片和计算的地方,AI迟早会出现,因此从商业和应用层面看,AI毫无疑问代表未来 [13] - 在AI时代,信任绝不能外包给机器,它本质上属于人类,存在于个体、社区与社会层面,必须将新的规范织入社会肌理,并将信任纳入治理模型进行迭代 [6][15] - 对于创业者而言,无论开发何种产品或业务,从一开始就要重视信任,其根源始终来自人的主动性 [15] 创新精神与文化 - 科学家和创业者都需要保持“智识上的无畏”(Fearless),即心怀无所畏惧的精神,以摆脱束缚创造力、勇气和执行力的枷锁 [16] - 当确定无疑的简单任务与充满不确定性的任务难度相当时,应选择更不确定的那一条,因为在不确定中,创造力会被逼至极限,奇迹才能发生 [6][17]
理想汽车
数说新能源· 2025-11-27 10:03
公司战略方向 - 公司决定从2025年第四季度起,由创始团队主导,全面回归创业型组织模式,放弃过去三年尝试的职业经理人模式 [1][2][3][4][5] - 回归创业模式的原因包括行业技术快速变化、创始团队更擅长创业模式、创始人拥有27年创业经验且头部企业如英伟达和特斯拉仍采用此模式 [3][4][5][18] - 创业模式核心包括加强交流而非写报告、聚焦为用户创造价值而非短期交付量、持续提升效率而非消耗资源、抓住核心问题而非制造信息不对称 [4] - 公司明确选择将产品定位为具身智能机器人,而非单纯的电动汽车或智能设备,认为前者能实现从被动执行到主动服务的升级,解决用户高频生活场景需求 [6][7][8][9][18] - 单纯电动汽车竞争聚焦参数竞赛,智能设备创新多为手机功能迁移,均无法创造增量用户价值,而具身智能是未来十年最具价值的方向 [6][7][8][9][18] - 针对具身智能,公司将构建面向物理世界的全栈AI系统,核心技术突破方向包括感知层、模型层和硬件层 [10][11][12][13][19][20][21] 技术路线与研发进展 - 感知层计划升级到3D视觉Transformer,将有效感知范围从当前约100米提升2-3倍,需配套自研具身智能芯片和编译器优化 [11][19] - 模型层需优化运行频率,当前40亿参数MOE模型运行频率仅10Hz,目标提升2-3倍至60Hz,需定制GPU架构和操作系统 [12][20] - 硬件层开发Drive Biowire系统,将自动驾驶感知-执行闭环响应时间从550毫秒降至350毫秒,可降低事故率超50% [12][21] - 自研具身智能芯片M100专为具身智能设计,处于大规模系统测试阶段,预计2026年商用,目标性能成本比达当前高端芯片3倍以上 [30][45] - 全栈自研BEV技术聚焦电驱动、电池系统和电控三大板块,电驱动自研碳化硅功率芯片、功率模块和电机控制器,并设干式电机工厂 [30][37] - 电池系统掌握5C超充电池全栈能力,自研5C电池预计2026年量产,电控系统全栈自研动力域控制软件和核心域控制器PCB及底层软件 [30][31][32][37] - VLA驾驶系统已全量推送,覆盖复杂路口路径选择,OTA 8.0聚焦安全,12月初将发布OTA 8.1增强感知能力,年底前完成架构升级以适配M100芯片 [30][44] 2025年第三季度财务表现 - 第三季度总收入274亿元,同比下降36.2%,环比下降9.5%,其中车辆销售收入259亿元,同比下降37.4%,环比下降10.4% [16][22] - 毛利率16.3%,同比下降5.2个百分点,环比下降3.8个百分点,剔除Li Mega召回成本后毛利率为20.4% [16][23] - 车辆毛利率15.5%,同比下降5.4个百分点,环比下降3.9个百分点,剔除召回成本后为19.8% [16][24] - 研发费用30亿元,同比增长15%,环比增长5.8%,主要因新车项目、产品组合扩张及技术投资增加 [16][25] - 净亏损6.244亿元,去年同期净利润28亿元,上季度净利润11亿元,稀释后每ADS净亏损0.2元 [16][26] - 截至季度末现金储备989亿元,经营活动净现金流出74亿元,自由现金流出89亿元 [17][27][28] - 2025年第四季度预计车辆交付量10万-11万辆,预计总营收292亿元至365亿元 [17][29] 产品与市场运营 - I系列车型覆盖主流及高端家庭市场,支持EREV+BEV双能源策略,已进入北京、上海、江苏等核心市场,9月起订单显著增长 [30][38] - 11月起对I6电池采用双供应商策略,预计2026年初月产能稳步提升至约2万辆 [30][38] - 2026年L系列将进行重大代际升级,回归简化SKU策略,基础款标配全部核心功能,全系标配5C超充并整合现有充电网络 [30][41] - 针对新能源购置税调整,公司预计2025年底订单前置导致2026年Q1交付量大幅下滑,2026年全系车型满足新能耗标准以获取补贴 [34][39][40] - 推出"安心购车计划"为2025年下订、2026年交付的iX系列用户补贴购置税差额,2026年目标运营4800座超充站,其中35%位于高速服务区 [34][40] - Li Mega召回成本已在Q3计提,当前优先生产电池包用于召回替换,导致Mega交付量下降 [34][43] 供应链与现金流管理 - 供应链方面,I6车型11月起实施电池双供应商策略以解决产能瓶颈,当前应付账款结算周期为68天,支付方式为电汇或银行承兑汇票 [34][38] - 现金流下滑主要因Q3交付量压力导致营收下降,以及响应供应商要求缩短付款周期 [34][38][39] - 公司持续推进供应链本地化,发挥规模优势稳定产品价格,并加快产品更新换代 [34][40]
图片生成仿真!这个AI让3D资产「开箱即用」,直接赋能机器人训练
量子位· 2025-11-23 12:09
技术突破与核心创新 - 提出PhysX-Anything框架,是首个面向仿真、具备物理属性的3D生成范式,仅需单张图像即可生成高质量、可直接用于仿真的3D资产[5] - 该框架能同时生成显式几何结构、关节运动以及物理参数,解决了现有方法普遍缺失密度、绝对尺度、关节约束等关键物理信息的问题[5][6] - 采用由粗到细的生成框架,通过多轮对话依次生成整体物理描述与各部件几何信息,最终解码输出六种常用格式的可仿真3D资产[8] 技术实现细节 - 提出一种新型3D表征方式,基于体素构建几何表示,在32体素网格上由视觉语言模型建模粗略几何,再由下游解码器细化,实现超过193倍的token压缩比[10][27] - 设计可控的flow transformer模块,将粗体素表示作为扩散模型的引导信号,以控制细粒度体素几何的生成[14] - 使用最近邻算法将重建网格划分为部件级组件,结合全局结构信息与细粒度体素几何,生成用于仿真的URDF、XML及部件级网格[15] 性能评估与比较 - 在PhysX-Mobility数据集上的评估显示,PhysX-Anything在几何与物理两类指标上均取得最优表现,其绝对尺度误差大幅降低至0.30[18][19] - 在基于视觉语言模型的评估中,PhysX-Anything在几何与运动学参数两项指标上均显著优于所有对比方法,得分高达0.94[20][21] - 人类志愿者评估结果显示,PhysX-Anything的生成结构在几何与物理属性都获得最高分,几何得分为0.98,物理属性多项得分在0.84至0.98之间[22] 应用潜力与行业影响 - 生成的仿真就绪3D资产可以直接导入模拟器,并用于接触丰富的机器人策略学习,展示了在推动多种下游机器人与具身智能应用方面的巨大潜力[25][26] - 该框架有望为3D视觉、具身智能与机器人研究开辟新的方向,推动从“视觉建模”到“物理建模”的范式转变[28] - 团队构建了覆盖47个常见真实类别、具备丰富物理标注的PhysX-Mobility数据集,大幅拓展了现有物理3D资产的多样性[27]
苹果AI陷“信心危机”:又一位华人高管出走,转投Meta机器人团队
36氪· 2025-09-04 17:30
核心人才流失情况 - 苹果AI部门2025年以来持续遭遇人才流失,机器人AI研究团队负责人张健及基础模型团队三名研究员约翰・皮布尔斯、杜楠、孟兆确认离职[1][3] - 自Meta开启人才争夺战以来,苹果累计流失至少10名AI核心人才,包括基础模型团队前负责人庞若鸣[1][3] - 流失人才主要流向Meta、OpenAI、Anthropic等竞争对手,其中庞若鸣加入Meta的薪酬包价值超过2亿美元[3][9] 关键人员背景及影响 - 张健在苹果任职十年,领导十余人的机器人研究团队,其团队为苹果搭建了覆盖环境感知、动作执行到情感表达的完整机器人技术体系[5] - 张健团队研发的技术原型支撑苹果零售环境桌面设备开发,其计算成像专业能力为Apple Intelligence提供关键技术保障[6] - 张健学术论文被国际顶级会议引用数千次,离职后加入Meta担任机器人技术首席总监,主导模型训练与物理机器控制结合项目[5][8] 战略与管理问题 - 苹果内部考虑采用第三方模型支持下一代Siri,高层否决开源部分模型提议,与公司强调自主创新的传统相悖[1][10][12] - Siri的"V2"架构重建陷入混乱,导致高级功能推迟至至少2026年上线[12] - 公司保密文化与AI研究需要的开放协作特性冲突,官僚流程阻碍创新,研究人员认为在苹果"创新被流程扼杀"[9][12] 资源与组织挑战 - 苹果数据中心老旧硬件难以满足大模型训练需求,相比竞争对手数百亿美元的基础设施投入处于明显劣势[14] - 人工智能与机器学习团队在内部资源分配中处于"二等公民"地位,硬件和产品部门始终享有优先权[14] - 领导层频繁变动加剧内部不稳定,团队士气严重受挫,主动寻求外部机会成为普遍现象[12][14] 行业竞争格局 - Meta通过高额薪酬包(如超过2亿美元方案)和加速推进"超级智能"计划持续吸引苹果人才[9][13] - Meta致力于打造人形机器人AI平台,目标成为第三方机器人制造商的核心AI供应商[8] - 竞争对手OpenAI、Anthropic、xAI在AI领域加速布局,而苹果内部调整进度迟缓[15]