物理 AI
搜索文档
每周工作100小时!谷歌DeepMind CEO揭秘:中国对手是字节跳动,断言谷歌是AI领域唯一全栈巨头
搜狐财经· 2026-01-23 20:01
谷歌的竞争状态与内部文化 - 过去三到四年,谷歌AI团队几乎一直处于红色警报状态,工作强度极大,CEO本人保持每周100小时、一年50周的工作节奏[1] - 公司通过整合谷歌与DeepMind,并发布Gemini 3,被视为重新回到了行业最前沿[3][11] - 创始人拉里·佩奇与谢尔盖·布林参与度很高,佩奇负责战略层面,布林则深入参与Gemini的算法编码等具体工作[16][17][18] - 公司文化正努力融合初创企业的快速冒险精神与大企业的资源优势,同时为长期研究保留空间[18] 谷歌的技术实力与全栈能力 - 过去十年,现代人工智能行业所依赖的关键突破,如Transformer架构、深度强化学习、AlphaGo背后的技术体系,几乎都诞生于谷歌与DeepMind[3][12] - 现代人工智能行业所依赖的约90%的突破性技术都是谷歌研发的[4][33] - 公司被认为是唯一真正具备AI全栈能力的公司,拥有从研究、算力、数据、硬件、数据中心、云业务到前沿实验室和数十亿用户产品矩阵的完整能力[3][13][14] 对AI技术路径与AGI的展望 - 通用人工智能有50%的概率在2030年实现,但标准极高,需具备完整的人类认知能力,尤其是科学创新能力[4][28][29] - 实现AGI可能还需要一到两项,最多不超过五项突破性技术,可能体现在世界模型、持续学习、稳定性、更强推理或更长远规划能力等方面[8][31][32] - 不认同Transformer和大模型已走到尽头的观点,认为有50%的可能通过优化并扩大现有方法的规模来实现AGI[29][30] - 物理AI正处于突破的临界点,但距离实现还需18个月到两年,需要在算法、数据和硬件(如机械手)上进一步完善[3][19][20][23] Gemini模型的定位与未来方向 - Gemini从一开始就被设计为理解现实世界的多模态系统,是通往物理AI的入口,而非单纯的聊天模型[3][21] - 未来Gemini将主要走向两个方向:随身的通用AI助手(如集成于眼镜、手机)和真正能干活的机器人[7][22] - 公司已与波士顿动力展开深度合作,将AI技术应用于汽车制造领域,预计一两年后展示成果并实现规模化应用[24][25] 对中国AI竞争格局的评价 - 不认为DeepSeek构成真正意义上的“危机”,并指出西方舆论夸大了其算力效率优势,因其背后仍依赖西方模型蒸馏[4][26][27] - 中国公司极其擅长追赶,但尚未证明能率先打开下一代技术前沿[4][27] - 特别表扬字节跳动,认为其距离技术前沿大约只差6个月,而不是1-2年[4][27] AI对社会与工作的影响 - AI带来的变革,无论规模还是速度,都会是工业革命的十倍,取代部分人类工作不可避免,但大规模取代需要先解决系统稳定性问题[9][36][38] - 真正实现AGI后,可能进入“后稀缺时代”,借助AI解决能源(如核聚变)、新材料等根本性难题[9][37] - 人类需要适应变化,持续学习并熟练运用AI工具,这些工具将赋予个人超能力,尤其在创意艺术领域[39][47] - 更深层的风险在于,当工作不再必要,人类需要寻找新的生活意义和目标,这可能需要新一代伟大的哲学家[9][10][46] 对行业争议观点的回应 - 反驳了马斯克关于已进入技术奇点的判断,认为为时过早,技术奇点等同于完全的AGI,目前相距甚远[34] - 不认同OpenAI前首席科学家伊利亚·苏茨克维关于扩大模型规模时代即将结束的观点,强调公司从未离开过研发时代[33] - 支持在理想情况下全球暂停AI研发以进行科学合作与监管讨论,但指出当前国际合作存在障碍[40] 公司的信任基础与使命 - 选择谷歌是因为其创始于博士研究项目,以科学研究为核心,董事会成员包括图灵奖和诺贝尔奖得主,科学氛围浓厚[42][43] - 公司的使命是整合全球信息,而DeepMind的使命是破解智能奥秘,两者高度契合,AI能自然融入谷歌产品为世界提供价值[44] - 公司致力于以严谨、深思熟虑和负责任的方式推进技术,并在出现问题时尽快调整修正[43]
何小鹏:用汽车标准研发的 ET1 版本第一台机器人已落地
环球网资讯· 2026-01-20 14:01
公司技术研发进展 - 公司研发的ET1版本第一台机器人顺利落地 该机器人采用汽车标准研发 标志着向2024年规模量产高等级人行机器人迈出了关键一步 [1] - 公司董事长何小鹏表示 2026年公司将迎来物理AI的落地与规模量产 实现从技术探索向实践应用的关键跨越 [1] 公司未来产品规划 - 公司计划在2026年第一季度实现第二代VLA(视觉激光雷达融合感知系统)上车 [1] - 公司计划在2026年开启运营Robotaxi(自动驾驶出租车) [1] - 公司计划在2026年实现人形机器人的规模量产 [1] - 公司计划在2026年实现飞行汽车的规模量产 [1]
当黄仁勋在CES重申物理 AI 路径,它石已提前走通具身智能 Scaling Law
具身智能之心· 2026-01-13 12:47
行业技术发展路径 - 自动驾驶被广泛认为是通向物理AI与具身智能的关键技术路径和“钥匙”[2] - 自动驾驶与具身智能在技术上同宗同源,自动驾驶是具身智能的一个关键子任务,代表了智能体在复杂物理环境中的移动与导航能力[3] - 自动驾驶中成熟的端到端系统,统一了时空坐标下的感知、决策与规划,为机器人在物理世界中的理解与行动提供了根本性的底层框架[3] 公司技术前瞻与行业地位 - 公司创始人早在2025年7月便在世界人工智能大会上系统阐述了自动驾驶与具身智能的技术同源性,时间领先业界半年以上[2] - 公司基于对物理AI发展路径的早期战略判断和自动驾驶的深厚积累,推动具身智能从实验室走向真实世界应用[8] 核心驱动力:数据 - 业界共识认为,高质量、大规模、丰富的数据是遵循Scaling Law、驱动智能水平跃升的关键燃料[3] - 具身智能对高质量、真实数据的需求量是自动驾驶的十倍以上[3] - 公司提出了“以人为中心”的真人数据采集新范式,并于2025年12月开源了全球首个具身VLTA多模态数据集World In Your Hands[5] 数据价值与技术创新 - 融入“以人为中心”的数据后,机器人在极其杂乱场景中的操作成功率由8%暴涨至60%,并显著提升了灵巧手在桌面操作任务中的泛化性与稳定性[5] - 公司自研的数据采集套件实现了厘米级的运动捕捉精度,并能输出包含6D位姿信息的高丰度数据流[6] - 该创新路径降低了数据采集难度与成本,单采集员日均5小时内即可采集生成1.8TB数据,为训练更强大的模型构筑了可扩展的数据供给基础[6] - 公司首席科学家表示,“以人为中心”的数据采集范式配合其数据引擎,可以记录和生产最高质量、最丰富的具身智能数据,真正使得Scaling Law成为可能[5]
具身智能行业研究:上纬启元Q1正式亮相,宇树腾讯战略合作落地
国金证券· 2026-01-11 20:50
报告行业投资评级 * 报告未明确给出行业投资评级 [1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41][42] 报告核心观点 * 机器人行业景气度加速向上,2026年是人形机器人从0到1兑现的重要节点,有望成为规模量产元年 [1][3][15][34] * 马斯克宣布特斯拉第三代机器人设计定型,发布在即 [1] * 全球首款全身力控小尺寸人形机器人“上纬启元 Q1”正式亮相,专注于个人与家庭场景 [1][14][24][26] * 腾讯 Robotics X 实验室与宇树科技达成战略协作,共同推动机器人在文旅、商业等场景的落地应用 [1][14][21][22] * 小鹏汽车宣布2026年将迎来物理AI的落地与规模量产,人形机器人是其构建的横跨海陆空“物理AI”生态的一部分 [2][14][19] * 征和工业发布全球首创链式灵巧手“臻手・CHOHO Hand”,单手承重达40公斤 [2][28][29][33] 根据相关目录分别进行总结 一、机器人行业动态 * 行业从政策引导转向商业化落地,推动具身智能产业长期发展 [8][9] * 韩国国家级智库报告首次明确指出,在智能汽车、机器人、半导体三大主力产业领域,中国的综合竞争力已全面领先于韩国 [9][11] * 英伟达CEO黄仁勋表示下一代Rubin架构推理成本将降低10倍 [4][9][11] * 智元提出SOP框架,让VLA模型在真实世界实现可扩展的在线进化 [4][8][9][11] * 智谱华章在香港联交所挂牌上市,首日开盘价120港元/股,市值528.28亿港元 [4][9][13] * AI大模型公司MiniMax在港股挂牌,首日收盘大涨109.09%,股价报收于345港元/股,市值攀升至1067亿港元 [4][9][13] * Manifold AI流形空间完成超亿元天使+轮融资,所募资金将用于世界模型的迭代和具身大脑的应用落地 [9][10][13] 二、机器人本体进展 * **上纬启元Q1**:全球首款全身力控小尺寸人形机器人,站立高度约0.8米,收纳模式下机身长度约0.5米,可折叠装入30-35L双肩包,体积与重量约为全尺寸机器人的1/8,主要面向科研者、创意玩家与家庭用户 [1][14][15][24][26] * **宇树科技**:与腾讯Robotics X实验室合作,搭载Tairos具身大模型的G1型号AI导览机器人“小莫”已在敦煌莫高窟数字展示中心上岗提供导览服务 [1][14][15][21][22] * **小鹏机器人**:宣布2026年将实现物理AI的落地与规模量产,构建横跨海陆空、贯穿出行与生活服务的“物理AI”生态 [2][14][15][19] * **波士顿动力**:在CES 2026上发布新一代Atlas人形机器人并官宣量产,现代汽车集团计划从2028年开始部署,目标年产3万台 [14][16] * **智身科技**:完成连续多轮融资,累计金额达数亿元,其两款主力机型钢镚L1、铜锤M1已实现规模化量产,并于2025年12月底完成了第5000台机器人的量产交付 [14][16] * **Omdia报告**:预测未来10年人形机器人市场将迎来指数级增长,到2035年全球出货量有望达到260万台,并指出智元以5168台的年度出货量占据全球39%的市场份额 [14][18] 三、核心零部件进展 * **征和工业**:发布链式灵巧手“臻手・CHOHO Hand”,单手承重达40公斤,兼具高承重、高抗力、高可靠、高耐久、高精度、高能效、低自重、低成本八大核心优势 [2][28][29][33] * **北特科技**:计划募资3亿元用于泰国丝杠生产基地(一期)建设,以提升行星滚柱丝杠产业化能力 [28][29][32] * **乐聚机器人**:与阿里云签署战略合作协议,共同探索人形机器人“大脑+本体+小脑”前沿技术融合,加速具身智能规模化落地 [28][29][30] 四、投资建议 * 2026年是人形机器人0-1兑现的重要节点,特斯拉链预计26年第一季度发布第一代量产产品,26年上半年供应链大批量产线建设完成,26年8月开启大规模量产 [3] * 全球将迈入机器人“军备竞赛”,重点关注五大方向 [3][34] * **特斯拉链的收敛**:硬件供应链趋于收敛,建议关注拓普集团、三花智控等 [3][34] * **技术迭代与收敛**:看好电驱动新技术、灵巧手、新材料、高端轴承等,建议关注宁波华翔等 [3][34] * **海外其他供应链的机会**:苹果、谷歌、OpenAI、Figure等陆续迈入0-1,建议关注银轮股份等 [3][34] * **国内本体和应用垂类机会**:宇树、智元、乐聚、银河通用等陆续上市,建议关注供应链以及本体标的 [3][34] * **布局“优质格局”的标的**:建议关注奥比中光、宁波华翔等 [3][34]
无需人工标注,轻量级模型运动理解媲美72B模型,英伟达、MIT等联合推出FoundationMotion
机器之心· 2026-01-11 10:17
当前视频大模型的局限性 - 视频大模型发展迅速,但在面对复杂的空间移动和物理规律时,依然“看不懂”物体如何运动[2] - 模型或许能描述视频中发生了什么,但难以回答涉及时序关系(如“红色的车是在蓝色车转弯之前还是之后通过路口”)或物理轨迹(如“皮球的抛物线轨迹最高点在哪里”)的复杂问题[2] - 在测试中,Gemini 3 Pro Preview未能理解视频中车辆最主要的运动行为(变道与超车),而是错误地描述为在车道上行驶[8] - 模型可以生成高速行驶的赛车,却难以判断刹车究竟是发生在碰撞之前还是之后;能描绘复杂的街景,却常常搞错行人的移动方向与相对位置关系[10] - 空间与运动是人类理解世界的基础,而这一能力恰恰是当前视频模型最薄弱的部分[9] 问题根源:数据匮乏 - 高质量运动数据极度匮乏是根本原因[3] - 现有数据集要么规模太小,要么依赖昂贵的人工标注,难以支撑模型学习真实世界中细粒度的物理运动[3] - 现有视频数据要么只包含静态描述,要么高度依赖昂贵、难以扩展的人工标注,使得大规模、细粒度的“运动理解”数据几乎无法获得[12] FoundationMotion解决方案 - 来自MIT、NVIDIA、UC Berkeley等机构的研究者提出了FoundationMotion,一套完全不依赖人工标注的自动化数据管线[4] - FoundationMotion是一套端到端、无需人工参与的自动化数据生成系统,可被视为一座全自动的“运动数据工厂”[13] - 其工作流程分为四步:1. 预处理;2. 使用目标检测与跟踪模型,将视频中的关键物体转化为连续的时空轨迹;3. 采用多模态融合策略,将轨迹信息转化为语言模型能理解的“运动说明书”;4. 利用GPT-4o-mini自动生成高质量的标注与问题[14][16][17][18] - 最终,团队基于InternVid构建了约50万条高质量运动理解数据,形成了FoundationMotion数据集[18] 技术效果与性能表现 - 仅用FoundationMotion生成的数据微调后,15B参数的视频模型在运动理解任务上超越了更大规模的模型[4] - 具体表现为:NVILA-Video-15B在AV-Car基准测试上达到90.6%,超越了Gemini-2.5-Flash的84.1%以及Qwen-2.5-VL-72B的83.3%[4] - 微调后的7B/15B模型在多个运动理解基准上,实现了对Gemini-2.5 Flash与Qwen2.5-VL-72B的越级挑战[26] - 这一提升是纯数据驱动的,不依赖额外的模型结构设计或复杂的推理策略,完全归功于数据的质量[26] - 模型在增强物理感知的同时,并未损害原本的通用视频理解能力,且在不同领域(自动驾驶、机器人操作、日常活动)均具备良好表现和强泛化性[26] 行业意义与应用前景 - FoundationMotion的意义远不止于刷榜,被认为是构建真正的具身智能的基础设施[23][27] - 在自动驾驶与机器人领域,“理解物体如何运动”直接关系到系统的安全与决策能力[24] - 该方案提供了一条低成本、可扩展的路径,让AI能够通过观看海量视频,逐步建立对物理世界的直觉[25] - 这套管线未来可广泛用于视觉语言模型、世界模型等领域,实现将轨迹转化为结构化文本描述、生成精细化运动描述(包含速度变化、方向、终止位置等细节)以及多维度运动理解问答(覆盖动作识别、时序关系、动作-物体关联、空间位置以及重复计数等关键能力)[25]
黄仁勋的“物理 AI 革命”:Alpamayo 让自动驾驶学会 “思考”
36氪· 2026-01-07 11:48
核心观点 - 英伟达在CES 2026上宣布“物理AI的ChatGPT时刻”已到来,其推出的Alpamayo自动驾驶AI系统标志着自动驾驶从“数据驱动”向“推理驱动”的关键转折 [1] 技术突破:Alpamayo系统 - Alpamayo是业界首个思维链推理VLA模型,通过生成可解释的推理轨迹来应对自动驾驶的“长尾问题”,使系统拥有“类人思考能力” [2] - 该系统采用100亿参数架构,支持通过视频输入生成轨迹与推理逻辑,开发者可基于此微调为更小的车载运行模型或搭建相关工具链 [3] - 英伟达为其构建了完整的开发生态,包括开源的AlpaSim仿真框架和超过1700小时的物理AI开放数据集 [3] - Alpamayo被定位为“教师模型”,旨在将其推理能力传授给车载的“学生模型”,让每辆车都具备应对罕见场景的智慧 [3] 商业落地与生态 - 首款搭载Alpamayo技术的汽车将于2026年第一季度在美国上路,合作方为梅赛德斯-奔驰 [3] - 双方合作耗时五年,投入数千人,构建了从芯片到软件的全栈解决方案,核心考量是安全 [5] - 除了梅赛德斯,Lucid、捷豹路虎、优步及伯克利DeepDrive等企业已对Alpamayo表现出兴趣 [7] - 英伟达通过“芯片+平台”模式已占据全球智驾芯片市场超70%的份额,Alpamayo的推出在“硬件霸权”上叠加了“算法生态霸权” [7] 战略意义与行业影响 - Alpamayo的发布将自动驾驶行业的竞争焦点从“算力”与“数据量”转向“推理能力” [10] - 对于传统车企,开源的Alpamayo生态降低了高阶智驾研发门槛,但也可能导致过度依赖英伟达而出现“技术空心化” [11] - 对于科技公司如Waymo、百度Apollo,需加快推理模型研发;芯片厂商如高通、Mobileye则需实现“算力+算法”的深度协同 [11] - 英伟达的野心不止于汽车,Alpamayo的推理框架可迁移至机器人、无人机等物理智能设备,公司正从“AI芯片公司”重塑为“物理智能基础设施提供商” [9]
英伟达开源智驾模型,想定义 “物理 AI 的 ChatGPT 时刻”
晚点Auto· 2026-01-06 10:59
英伟达在自动驾驶领域的战略与进展 - 公司创始人黄仁勋在2026年CES主旨演讲中宣称“物理AI领域的ChatGPT时刻已经到来”,并预测未来世界上将有**10亿辆汽车**实现高度或完全自动驾驶 [3] - 公司将包括自动驾驶汽车在内的机器人业务,定位为仅次于人工智能的第二大重要增长领域 [3] 英伟达发布的核心技术:Alpamayo模型 - 公司发布了自动驾驶开源VLA模型Alpamayo,宣称其是世界上第一个能思考、推理、自动驾驶车辆的开源AI系统,是其智驾技术全面转向“端到端”后推出的开源云端基座模型 [4] - Alpamayo第一代模型采用**100亿参数**架构,并配套提供仿真工具AlpaSim及包含**1700多小时**驾驶数据的开放数据集 [4] - 公司是第一家将此类云端模型开源的厂商,为不具备全栈自研能力或对开发速度要求不迫切的厂商提供了务实选择 [4] - 有资深从业者认为,**100亿参数**量级对于车端或云端部署而言,短期看都不大好用,云端作为世界模型参数规模偏小 [5] 英伟达在L2级辅助驾驶市场的商业化 - 公司在L2级辅助驾驶领域取得商业化进展,2025款梅赛德斯-奔驰CLA将搭载其L2级全栈辅助驾驶方案,硬件基础是**2颗**英伟达Thor芯片 [5] - 该方案计划于2026年一季度在美国上路,二季度在欧洲上路 [5] - 该方案采用双系统运行策略:具备推理能力的端到端AI系统处理复杂场景;基于规则的传统系统负责兜底,由策略与安全评估器实时监控并决定是否切换 [7] 英伟达自动驾驶业务的组织与挑战 - 公司招揽小鹏汽车前智驾负责人吴新宙加入,任全球副总裁兼汽车业务负责人,黄仁勋给予其三年时间带领团队拿下全球市场份额第一的目标 [7] - 吴新宙搭建了公司自动驾驶全栈自研部门,推进无图城市NOA方案研发并结合“端到端”技术迭代 [8] - 公司面临挑战,包括中国与北美团队的沟通协作问题,以及相比中国智驾供应商工作节奏更慢 [8] - 2024年4月,公司推出的无图城市NOA Demo版本体验不佳,导致其丢失了奔驰在中国市场的部分智驾方案订单 [8] - 截至2024年7月,新版无图城市NOA Demo表现已较4月份提升很多,公司计划每个季度迭代一个软件版本以提升体验 [8] 市场竞争格局与公司机遇 - 在智驾技术研发与部署上,理想、小鹏、蔚来、华为、地平线、Momenta等中国厂商已走在前面,完成了类似模型的研发甚至部署 [4] - 特斯拉已在北美落地“端到端”方案,多家中国厂商也已在中国上百座城市完成无图NOA方案的全量推送 [8] - 在竞争激烈的中国智驾市场,公司暂时落后于本土厂商 [9] - 海外市场(如欧美)的辅助驾驶渗透率仍处于较低水平,且对公司在地缘和商业关系上更具优势,是其重要机会 [9] - 随着Alpamayo发布及与奔驰合作落地,公司正试图重新夺回在自动驾驶领域的话语权 [9]
CES 2026|禾赛规划年产能翻番至 400 万,泰国海外工厂 2027 年初投产
金融界· 2026-01-05 22:38
公司产能与制造规划 - 公司规划年产能将从2025年的200万台提升至2026年的400万台,实现翻倍增长 [1] - 公司在泰国曼谷的新工厂“伽利略”建设稳步推进,预计2027年初投产,以提升全球产能布局 [1][7] - 公司自建集研发与生产于一体的综合中心,全自动化生产线平均每10秒即可下线一台激光雷达,支持大规模量产 [5] 量产交付里程碑与业绩 - 公司是全球首个年产量突破100万台、累计量产并交付超200万台激光雷达的企业 [3] - 2025年公司全年交付量超160万台,单月最高交付量超20万台,已连续五年全年交付量翻番 [3] - 2025年ADAS产品交付量约140万台,机器人产品交付量超20万台,爆款产品ATX开启交付首年即突破100万台 [3] - 公司全系激光雷达产品历史累计交付量已超240万台 [3] 产品与技术进展 - 在CES 2026上,公司正式展示了新一代L3车规激光雷达解决方案,包括超远距ETX与纯固态近距补盲FTX [9] - 新一代L3解决方案已斩获首个乘用车量产定点,计划于2026年底或2027年初启动量产 [11] - 公司近期新发布的ATX焕新版已累计获得多家头部车企超400万台订单,计划于2026年4月启动量产交付 [12] - 通过自主研发四代专用ASIC芯片,公司实现了产品快速迭代、高可靠性及可全球复制的规模化生产能力 [5] 客户与市场定点 - 公司已获24家主机厂超过120个车型的量产定点,核心客户包括欧洲顶级主机厂、全球新能源销量冠军车企及多家国内外头部车企 [12] - 公司已斩获前两大ADAS客户2026年全系车型定点合作,并实现100%标配 [12] - 公司已获多家海外头部汽车厂和国内头部新势力L3定点 [11] ADAS市场与安全价值 - 激光雷达在中国新能源汽车市场的渗透率已达28%,相当于每四辆新能源新车就有一辆配备激光雷达 [11] - 相比纯视觉方案,搭载激光雷达的车辆可降低90%的高速致命事故风险,并减少30%的常规交通事故 [11] - 随着L3级自动驾驶发展,相关车型将装载3-6颗激光雷达以提升安全冗余 [9] 机器人及多元化应用 - 在Robotaxi与自动驾驶卡车市场,公司激光雷达已应用于Motional、百度萝卜快跑、滴滴自动驾驶等多家企业的车辆中,部分车型计划搭载多达8颗激光雷达 [13] - 在机器人与工业市场,公司JT系列迷你型360°超半球3D激光雷达累计出货量已突破20万台,应用于割草机器人、智能伴随机器人等多元场景 [14] - 激光雷达作为物理世界的“AI之眼”,为机器人从受控环境走向多样化真实应用场景提供稳定、精准的环境感知关键支撑 [13]
小鹏拆掉过去的自己,再战 “物理 AI”
晚点LatePost· 2025-11-26 16:46
公司战略转向 - 公司经营压力缓解后,重新聚焦前沿技术冒险,目标是成为全球具身智能公司 [2][20] - 公司结论是革掉过去的成功经验,以对抗企业惯性,避免被竞争对手快速追上 [3][4] - 公司设立新目标:将虚拟AI规模化、可靠地部署在智能汽车、机器人、飞行汽车等物理AI领域 [3][20] 自动驾驶技术演进 - 公司4月发布第一代VLA技术路线,半年后科技日发布第二代VLA产品,新一代方案更拟人,出现读懂随机路人手势、红绿灯路口前蠕行等智能涌现 [3] - 第二代VLA产品思路极致简单:尽量使用视频而非大量文本,输入物理信号输出行为,做最极致的端到端架构 [8][9][10] - 公司智驾路径从传统模块化方案,转到端到端、VLA,再到下一代VLA,一年半内经历四次变化 [10] - 新一代VLA架构依赖大模型、大数据、大算力,训练投入3万张AI训练卡、20亿元费用、近1亿段驾驶数据 [12] - 公司计划明年推出三款Robotaxi车型,具备全球最高车端算力3000 Tops,整车有6套硬件备份冗余,第二代VLA架构为L4自动驾驶终极目标而生 [20] 机器人技术发展 - 公司去年发布首款人形机器人,今年初重新设计,增加脊椎、能收肩耸肩的肩膀、重新研发前脚掌关节,第七代产品行走体态高度拟人 [4][7] - 公司押注路线是先做能力60分的通用型人形机器人,再通过软件快速迭代场景功能,硬件迭代时间从半年以上缩短 [7] - 机器人团队采用AI驱动生成式运控路线,给机器人加脊椎、肌肉群、腹腔、皮肤等,实现走路腰和胯联动 [13] - 公司计划2026年底规模量产自研人形机器人,搭载3颗图灵AI芯片,有效算力2250 Tops,量产第八代机器人成本将与汽车BOM成本接近 [20] - 目前机器人优先进入商业场景提供导览、导购和前台导询服务,何小鹏预计2030年实现100万台机器人量产 [20][23] 飞行汽车业务进展 - 公司飞行汽车进度快于特斯拉,面向个人短途飞行的陆地航母已进入量产前最后阶段,预计2026年规模化交付 [21] - 公司近期科技日发布高航速、长航程的垂直起降电动飞机A868 [21] 组织与资源保障 - 公司自动驾驶负责人刘先明于2024年3月加入,与何小鹏在突破智驾瓶颈下一代技术架构上达成共识 [10][23] - 公司采取双线作战策略:一组团队迭代现有产品,另一组攻坚新技术,直到模型能力出现巨大跃升 [13] - 何小鹏作为一号位给予充分支持,在预算审批时最常问预算够不够,每年训练预算投入巨大 [23] - 公司招募更多AI人才,今年AI人才绝大部分来自毕业生,同时招揽成熟AI大牛,多位高级别AI人才加入自动驾驶和机器人团队 [24] 经营与产品规划 - 公司今年1-10月累计交付35万辆车,近期第100万辆整车下线,三季度综合毛利率突破20%,亏损收窄 [19] - 公司发布超级增程首款车型X9,售价30.98万元起,2026年形成纯电、增程两大阵营,明年推出7款具备超级增程配置的一车双能车型,涵盖4款全新车型,同时向海外推出3款新车型 [17][20]
贝索斯砸 447 亿复出搞 AI,马斯克吐槽“跟屁虫”
程序员的那些事· 2025-11-19 09:55
贝索斯创业项目概况 - 杰夫·贝索斯在卸任亚马逊CEO四年后重返一线创业,启动名为“普罗米修斯计划”的AI公司并亲自出任联合CEO [3][4] - 项目启动即获得62亿美元(折合人民币447亿元)融资,部分资金为贝索斯自掏腰包,成为全球资金最雄厚的早期AI初创公司 [4] - 与ChatGPT等对话式AI不同,该公司专注于“物理AI”,旨在让AI走出屏幕,在现实世界中执行具体任务,例如在风洞中进行飞机机翼测试或规划汽车产线的机器人协作 [4][5] - 为实现目标,公司在硅谷展开人才争夺,已从OpenAI、谷歌DeepMind等顶尖团队挖来近100名顶级研究员 [5] - 贝索斯的联合CEO搭档为谷歌前X实验室核心成员维克・巴贾吉,公司重点聚焦航空航天、汽车工程等硬核领域 [5] 与马斯克的竞争及历史恩怨 - 伊隆·马斯克对贝索斯的创业消息迅速做出反应,在社交媒体上嘲讽其为“跟屁虫”,暗示其模仿自己的业务方向 [6] - 马斯克认为贝索斯进入了其核心地盘,因马斯克旗下公司如XAI、特斯拉的Optimus机器人同样聚焦于AI在实体制造和工程领域的落地 [8] - 两位科技领袖的公开互怼历史持续近二十年,涉及多个领域 [8] - 历史冲突案例包括:2019年贝索斯宣布卫星项目Project Kuiper被马斯克指责模仿星链计划;同年贝索斯发布“蓝月”月球着陆器遭马斯克恶搞;2020年亚马逊收购自动驾驶公司Zoox再次引发马斯克嘲讽 [12] - 双方也存在“相爱相杀”的一面,例如马斯克曾对贝索斯旗下蓝色起源的火箭成功发射回收表示祝福 [9] 物理AI赛道发展前景 - 贝索斯与马斯克同时押注“物理AI”,预示着该赛道可能迎来爆发期 [10] - 当前主流AI模型主要基于网络文本和图像数据进行训练,擅长理论但缺乏对现实物理规律的理解,而“物理AI”的目标是解决真实世界的工程难题 [10] - 贝索斯方面具备447亿资金和顶级人才团队的优势,马斯克方面则拥有特斯拉、SpaceX的技术积累和实际落地经验,两者的正面竞争可能加速整个物理AI领域的研发进程 [10] - 大佬在人才和技术上的竞争可能像历史上的智能手机大战一样,最终催生更成熟的产品和技术,使整个行业受益 [10] - 尽管有投资者对AI行业资金扎堆表示担忧并进行相关做空操作,但顶级玩家显然将抢占下一个科技风口置于更高优先级 [10]