Workflow
物理世界大模型
icon
搜索文档
闪电快讯 | 小鹏汽车推出第二代VLA并围绕该架构发布Robotaxi、机器人
新浪财经· 2025-11-05 23:49
11月5日,电厂获悉,小鹏汽车在"2025小鹏科技日"上发布了第二代VLA——区别于传统VLA模型的"视觉-语言-动 作"架构,小鹏的第二代VLA无需语言转译,实现从视觉信号到动作指令的端到端直接输出。 第二代VLA也是小鹏首个量产物理世界大模型,它既是动作生成模型,也是理解和推演的物理世界模型,能够为AI汽 车、人形机器人、 飞行汽车提供了统一的智能基座。小鹏汽车成功在2250TOPS的Ultra版车型上搭载数十亿级参数规 模的第二代VLA。同时,用于第二代VLA的数据训练量接近1亿clips。 基于第二代VLA,小鹏发布了"小路 NGP", 把复杂小路的平均接管里程提升13倍;无导航自动辅助驾驶Super LCC和 人机共驾可以不依赖导航在全球范围开启,展现模型的泛化学习与智能水平。 小鹏第二代VLA将于 2025 年 12 月启动先锋共创体验,2026 年一季度随 Ultra 车型全量推送。何小鹏还宣布大众汽车 成为小鹏第二代VLA首发战略合作伙伴。同时,小鹏图灵AI芯片已获得大众汽车定点。 在第二代VLA的支持下,小鹏汽车还计划将于2026年推出三款Robotaxi车型、具备L4级体验的有人驾驶Rob ...
小鹏全新飞行汽车亮相:续航超500公里!何小鹏打出“安全牌”:高管先飞,必须飞满5000公里
每日经济新闻· 2025-11-05 19:22
活动上,小鹏汽车董事长、CEO何小鹏展示了全新的"汇天A868飞行汽车"。 图片来源:直播截图 每经编辑|金冥羽 据悉,该款飞行汽车设计目标续航里程超过500公里,这使其具备了执行城市间航线的潜力,而不仅仅是市内短途交通。设计巡航速度超过360公里/小 时,远超地面交通,能极大缩短出行时间。 11月5日,小鹏科技日(2025 AI DAY)正式开幕。 据透露,这一代IRON是预研的最后一个版本,量产版本将不高于170cm。据介绍,新一代人形机器人IRON首发应用全固态电池,并搭载3颗图灵芯片和 物理世界大模型。 何小鹏表示,小鹏汇天陆地航母全球订单目前已经7000单,并有望创造载人飞行器年销量世界纪录。 何小鹏还提到,小鹏飞行汽车会执行"高管先飞计划",汇天管理团队亲身验证飞行安全量产交付前,管理者飞行里程必须超过5000公里。 图片来源:直播截图 此外,小鹏汽车宣布,将在2026年推出3款Robotaxi(无人驾驶出租车)车型,并于2026年开启试运营。 图片来源:直播截图 何小鹏表示,整车厂自己投入做Robotaxi,更有利于推动该产业的规模化与商业化,同时小鹏将自研软件、自制硬件、开放SDK等。据规划, ...
前阿里机器人高管创业、获数千万种子轮融资,聚焦L4级具身智能技术应用|早起看早期
36氪· 2025-04-21 07:58
公司融资与背景 - 杭州影身智能技术有限公司近日连续完成数千万元种子轮、种子+轮融资 种子轮由卓源亚洲投资 种子+轮由卓源亚洲、杭州西湖科创投联合投资 融资资金将用于机器人右脑的开发训练、商业化落地与团队建设[4] - 公司成立于2024年 专注具身智能技术研发与应用 基于自主研发的空间大模型和工业场景机器人 为企业提供低成本、高可靠、模块化的软硬件协同方案 从轻工业柔性工序切入 落地服务业及多种C端场景[4] - 创始人兼CEO闵伟曾任前阿里巴巴机器人团队技术负责人 从0到1搭建了阿里本地生活配送机器人 核心团队成员多来自清华大学 在人工智能和机器人领域有多年技术研发及产品应用经验[4] 技术研发与创新 - 自主研发的时空智能大模型通过Real to Real构建四维真实世界大模型 通过大规模无标签数据预训练 具备对物理世界理解和映射的基础能力[6] - 直接对视频数据建模 将视频语言化 直接从视频数据中提取最真实的信息理解物理世界 减少人为干预 提高模型精确性和效率 减少自然语言抽象带来的信息损耗[6] - 利用国内海量视频数据 训练成本控制在极低水平 通过布置多个摄像头从不同角度捕捉工人工作画面 用于三维空间建模、动作捕捉和动作生成模型训练 无需购置额外复杂设备 简化训练流程[7] 商业化进展与规划 - 已发布"影身"系列工业机器人 能在不同工况下持续稳定操作 具有泛化性[8] - 已拿下千万级产业订单 首先聚焦服务于工厂场景 持续拓展至快递、酒店等行业 预计2025年将累计交付上百台机器人[8] - 今年将着力开发机器人大脑 提升机器人理解外部世界并执行任务的能力 加快实现将L4级别具身智能普及到日常生产和生活中[8] 行业趋势与技术挑战 - 具身智能的进阶指智能体在复杂物理环境中需展现出更高级的行为 从简单动作执行到复杂任务协同处理 具备更强环境感知、决策规划和执行能力[5] - 泛化指机器人可将特定场景学到的技能应用到新场景 受物理规律、物体属性及环境动态变化影响 需对物理世界有深入、全面且精准的理解 物理世界大模型起到关键作用[5] - 语言模型在机器人领域存在局限性 物理动作的时空连续性与语言符号的离散性存在根本矛盾 需通过视觉感知、物理常识等机制补充信息[6]