VLA模型

搜索文档
顶级专家带队,这家创企宣布万台人形机器人量产计划!
Robot猎场备忘录· 2025-05-15 14:35
核心观点 - 智平方发布全栈自研全域全身具身智能大模型Alpha Brain和新一代仿生机器人AlphaBot 2,具备从桌面到开放环境、从单臂到全身、从简单到长程任务的能力 [1][3] - Alpha Brain采用GOVLA架构,整合空间交互基础模型、慢系统(System2)和快系统(System1),实现复杂逻辑推理与实时动作控制 [5] - 公司首次将DeepSeek技术融入VLA大模型,提升长程复杂任务理解能力,并与优必选科技等企业共同推动双系统架构VLA模型成为行业主流 [5][8] - AlphaBot 2搭载Alpha Brain,具备34+全身自由度、0-240cm垂直工作范围和6h+续航能力,适配汽车制造、半导体等多场景任务 [7][8] 技术架构 - GOVLA大模型由空间交互基础模型、慢系统(System2)和快系统(System1)组成,慢系统负责复杂逻辑与任务拆解,快系统控制实时动作 [5] - 双系统架构技术路径将VLA拆分为VLM和动作执行模型,解决传统VLA数据采集难和长期规划问题,提升复杂场景适应性 [13] - 智平方是国内最早研发端到端VLA模型的企业,其RoboMamba模型在未见任务泛化能力上超越Google RT系列模型 [14] 商业化进展 - 公司已签约多家车企和高端制造企业,2024年实现数千万收入,并提供AI2R Brain MaaS订阅服务,计划按"智能操作工时"收费 [20] - 与吉利科技晶能微电子合作研发半导体制造机器人,与华熙生物开发生物科技领域智能解决方案 [24] - 目标2028年实现万台应用,2030年达成百亿级营收,2033年拓展至百万台规模 [20] 融资与行业动态 - 2025年完成Pre-A+轮数亿元融资,投资方包括敦鸿资产、云启资本等,此前Pre-A轮由达晨财智领投 [25] - 具身智能赛道吸引车企和自动驾驶领域人才创业,它石智航等公司完成亿级融资,行业进入融资热潮 [22][23] - 行业共识认为全栈自研是核心竞争力,智平方等具备AI+本体能力的企业更受资本青睐 [26][27] 创始团队背景 - 创始人郭彦东为国家级创新领军专家,曾任小鹏汽车首席科学家和OPPO首席科学家,具备AI与硬件复合背景 [17] - 副总裁邱巍拥有清华大学和德国高校背景,曾在西门子工作13年,后加入驭势科技任高管 [17] - 核心团队来自微软、小鹏、OPPO及清华、北大等顶尖高校,覆盖AI、机器人、智能终端领域 [18]
进厂“试用期”一年,人形机器人“转正”还要跨过几道坎?
第一财经· 2025-04-29 19:39
具身智能与VLA模型发展 - 灵初智能发布Psi-R1大模型,声称是真正的VLA模型,能在开放场景下解决长程复杂任务[2] - 2025年以来至少有七家企业发布VLA相关模型,包括Physical Intelligence、英伟达、银河通用等[2] - VLA模型成为机器人厂商展示技术先进性的重要手段,但部分展示视频可能掩盖真实技术能力[7] 机器人进厂打工的挑战 - 人形机器人从实验室到实际工厂应用需经历漫长的概念验证阶段,目前大部分仍处于试用期[2][10] - 概念验证需证明技术成功率、可靠性、效率、成本和收益,是商业化落地的关键障碍[3] - Figure机器人被曝在宝马工厂实际仅有一台执行简单搬运任务,与展示视频存在差距[10] VLA模型的技术难点 - 动作信号输入是VLA模型的核心难点,缺乏动作输入会导致泛化性不足和长线推理偏差[5] - 真正的VLA模型需具备长时序动作执行能力、跟随描述性语言指令并由单一模型完成所有任务[8] - 当前部分VLA模型仅通过模仿学习加原子技能调用完成简单操作,缺乏自主推理能力[7] 机器人落地的工程化流程 - 工厂落地需经历三个阶段:3个月实验室环境内测、3个月客户场景验证、6个月有人陪产部署[12] - 实际工厂环境中存在光线干扰、电磁干扰、流程差异等问题,需针对性优化[12] - 部署阶段需应对人为打断等突发情况,要求上层大脑具备实时推理和决策能力[13] 人形机器人的应用场景选择 - 当前进厂机器人多从事搬运、检测等基础工种,如优必选S1进行物料搬运和车灯检测[14] - 未来目标应是替代人力完成自动化设备无法胜任的精细化工作,如3C制造质检[14] - 客户更关注落地可行性而非技术完美性,需平衡长程推理能力与实时控制要求[15]
你的机器人“牌搭子”,来了!北京人形创企发布最强分层端到端VLA模型!
Robot猎场备忘录· 2025-04-29 00:58
灵初智能技术突破 - 公司发布全球首个支持"动作感知-环境反馈-动态决策"全闭环的VLA模型Psi-R1,采用分层端到端架构结合强化学习算法,攻克开放场景下的长程复杂任务挑战[3] - Psi-R1模型在麻将场景中展示30分钟+持续CoAT超长任务时长能力,实现100%准确翻牌、自主构建碰杠策略链、多体协同看牌及动态算牌等灵巧操作[3][4][6][9] - 模型采用"快慢脑"分层架构(快脑S1专注操作/慢脑S2专注推理),突破传统VLA单向决策局限,首次实现视觉-语言-动作多模态协同的CoAT思维链[11] - 同步发布16自由度灵巧手PsiBot H1和双臂轮式机器人PsiBot V1,形成完整技术闭环[17] 行业技术趋势 - 2025年双系统架构VLA模型成为行业主流,Figure AI/Physical Intelligence/英伟达/智平方等国内外企业均推出类似架构产品[14][15] - VLA模型通过拆分VLM与动作执行模块,解决数据采集难和长程规划问题,使机器人能应对复杂长跨度任务[17] - 行业技术路径从纯模仿学习转向结合互联网视频学习人类技巧,显著提升泛化能力[17] 公司发展历程 - 2024年12月发布首款强化学习端到端模型Psi R0,实现Pick&Place长程泛化;2025年3月升级至Psi R0.5,仅需2小时数据即可完成场景泛化[19] - 采用强化学习复合路线攻克"高泛化性-高鲁棒性-高泛化性"不可达三角,目标实现超越人类的灵巧操作[21] - 成立两个月即获高瓴创投/蓝驰创投天使轮融资,智元机器人参与投资[21] 团队与产学研合作 - 创始团队由70-00后跨年龄梯度组成,含产品老兵和科学家密度最高的组合,CEO王启斌博士拥有20年机器人商业化经验[21] - 与北京大学成立联合实验室,由强化学习专家杨耀东博士担任首席科学家,合作开发多模态版DeepSeek-R1模型[22] - 可能成为国内最先受益于DeepSeek开源红利的公司,已基于Align-DS-V开展VLA深度探索[22] 商业化布局 - 当前聚焦双手双臂轮式机器人操作能力,暂不涉及双足机器人[22] - 已与制造业/商超零售/跨境物流龙头企业合作,规划从泛工业→泛零售物流→家庭应用的梯次落地路径[22] 行业竞争格局 - 全球超200家企业布局具身智能,灵初智能属于同时涉足大模型和机器人本体的典型代表,同类企业包括智平方/它石智航/星海图等[23] - 软件算法进步成为推动人形机器人场景拓展的关键,自研大模型构建技术闭环是企业的核心竞争壁垒[23] - 多数人形机器人初创公司AI投入不足,依赖科技大厂赋能,但科技巨头可能亲自下场造人形成终局竞争[24][25]
理想汽车-W(02015):专题报告:从汽车到人工智能,公司有望重估
国海证券· 2025-03-13 09:14
报告公司投资评级 - 评级为买入(上调) [1][49] 报告的核心观点 - 理想汽车未来有望从电动智能汽车企业升级为人工智能公司,其AI潜力和2025年汽车业务表现均有望重估 [7][43] - 明确从车企向人工智能车企升级,短中期关注高阶智能驾驶和理想同学,远期聚焦具身智能和“硅基家人” [7][43] - 考虑高端市场格局变化和自身纯电业务准备,理想汽车增程基盘稳定性和纯电新品胜率可能被低估 [8][44] - AI打开新空间,且基盘稳定性和纯电胜率或被低估,理想汽车有望迎来重估,上调至“买入”评级 [8][44] 根据相关目录分别进行总结 汽车业务:增程基盘的稳定性和纯电新品的胜率或被低估 - 理想汽车全系车型25万元及以上,除L6外均超30万元,定位高端家庭豪华SUV,2024年交付量超50万辆 [14] - 理想汽车主要目标市场30 - 50万元,2024年前三季度占比10%,中长期市占率有望提升 [19] - 自主品牌替代合资有规律,0 - 30万元细分市场处阶段3,30 - 60万元细分市场将进入阶段3,60万元以上细分市场即将进入阶段1 [23] - 法系、日系、美系等合资品牌颓势显露后萎缩加速,2024年BBA高端市场颓势已现 [24][27] AI升级:短中期高阶智驾+理想同学,远期具身智能+硅基家人 - 理想AI技术底座包括语言模型Mind GPT和空间模型(智能驾驶技术),二者未来有融合趋势 [33] - 理想汽车智驾布局早,2024年发展加速,有望在2025年实现L3,3年实现L4 [35] - 基于Mind GPT的理想同学APP将从车机扩展至多终端,2024年12月登录手机终端,功能多样 [37] - 理想汽车年研发投入超100亿元,人工智能研发占比近50%,目标进入中国大语言模型基座竞争前三 [42] - 理想汽车认为AGI分三个阶段,未来战略包括技术融合、产品布局和市场定位调整 [42] 投资建议:AI打开新的空间+汽车或被低估,理想汽车有望迎来重估 - 理想汽车有望从电动智能汽车企业升级为人工智能公司,AI潜力和汽车业务2025年表现有望重估 [43] - 短中期关注高阶智能驾驶和理想同学,远期关注具身智能和“硅基家人”,理想同学APP用户数可能快速增长 [43] - 考虑高端市场格局和自身纯电业务准备,增程基盘稳定性和纯电新品胜率可能被低估 [44] - 预计理想汽车2025/2026年归母净利润133.5/191.8亿元,对应市值PE为17X/12X,上调至“买入”评级 [44]
晚点独家丨长城投资元戎启行 1 亿美元,高阶智能驾驶有了第三家量产供应商
晚点LatePost· 2024-11-01 20:46
元戎启行融资与技术进展 - 元戎启行完成1亿美元C轮融资,由长城汽车集团独家投资,累计融资超5亿美元,股东包括复星锐正、云启资本、阿里巴巴等[3] - 公司目前拥有约700名员工,已成为长城汽车和吉利与奔驰合资品牌Smart的智驾方案供应商[3][4] - 元戎启行采用端到端辅助驾驶方案,为长城新蓝山和smart精灵5提供无图城区NOA功能,支持9座城市的城区领航辅助驾驶[4] - 公司成立于2019年,创始人周光曾为Roadstar.ai联合创始人,初期瞄准L4级自动驾驶,2020年转向前装量产智驾方案[5] - 元戎启行选择激进技术路线,2020年投入BEV架构,2023年首批研发端到端架构,计划基于英伟达Thor平台开发VLA模型[5] 高阶智驾市场竞争格局 - 元戎启行成为全球第三家能提供城区NOA功能的第三方供应商,前两家为华为和Momenta[5] - 其他加快城区NOA上车的供应商包括英伟达、大疆车载、地平线和轻舟智航等[6] - 地平线发布SuperDrive高阶智驾方案,预计2025年量产;轻舟智航目标将城市NOA打入15万级车型[6] - 大疆车载发布硬件成本7000元的"7V+100TOPS"方案,英伟达推出基于Orin芯片的高阶解决方案[6] - 车企与供应商关系从一对一绑定变为多元合作,长城同时与毫末智行、Momenta等多家方案商合作[6] 行业发展趋势 - 高阶智驾方案将从20万元以上车型向更低价格区间渗透,并逐步从新能源车扩展至燃油车[7] - 大疆车载计划在10-20万价位段向上突破,Momenta将基于高通芯片开发适合15万级混动/燃油车的方案[7] - 服务海外汽车品牌成为提升客单价的重要途径,Momenta已与奔驰、丰田合作,元戎启行接触欧日韩车企[7][8] - 老牌供应商侧重ROI,关注车型预期销量和利润;新入局者更看重标杆客户以证明实力[6] - 中高阶辅助驾驶市场竞争焦点转向全价位段渗透和服务国际车企[8]