VLA 模型
搜索文档
清华90后博导做机器人,一把融了10个亿
36氪· 2025-11-24 09:06
公司融资与市场地位 - 星动纪元完成近10亿元融资,投资方包括吉利、北汽等车企以及鼎晖VGC等机构 [1] - 公司成立不到两年,此轮融资规模在业内少见 [1] - 公司已交付200多台机器人,其中超过一半销往海外,交付进度在行业内极为罕见 [7] 公司技术与产品优势 - 坚持软硬一体技术路线,自研从大模型到机器人本体的全栈技术,可控性强 [3][5] - 2024年推出灵巧手XHand 1,能操作百余种工具,是当时国内少数能接近国际水平的执行器 [7] - 2025年发布双足人形机器人L7,在世界人形机器人运动会上打破跳高、跳远等项目的记录,标志公司进入行业第一梯队 [7] - 产品已陆续开始量产 [4] - 推出ERA-42模型,将视觉感知、语言理解和动作决策统一框架内,减少模块割裂带来的误差 [10] 行业发展趋势与竞争格局 - 人形机器人行业仍处于早期阶段,整体格局尚未完全稳定 [9] - 行业核心难点集中在本体能力(运动、平衡、精细操作)和数据获取(真实物理交互数据不足) [8] - 行业普遍认为“人形本体 + 端到端模型”是下一阶段的主路径 [9] - 具身智能底层技术快速演进,VLA模型成为主流方向,世界模型与大模型结合使机器人具备环境预测能力 [10] - 硬件成本随规模扩大而下降,关键部件单价有望持续降低,加速大规模部署 [10] - 竞争重点从单一产品转向生态建设,通过构建开发者平台和开放SDK来确立行业标准 [10] - 机器人应用场景正从汽车工厂的自动化任务,扩展至柔性制造、零售服务、养老辅助、科研教育、巡检安防等多领域 [2][10] 资本投资逻辑 - 资本(机构与车企)寻找具备“能量产、能落地”能力的团队 [2] - 产业资本最看重软硬一体的技术体系以及跨场景落地能力 [3] - 车企投资旨在在新终端上占据位置,并以其供应链、量产经验和验证场景帮助机器人公司推进产品落地 [2]
首程控股20251116
2025-11-16 23:36
**首程控股 2025年前三季度业绩及业务进展电话会议纪要关键要点** **一、 公司概况与核心财务表现** * 公司为中国领先的智能基础设施资产服务商,专注于资产运营和资产融通两大核心方向[3] * 2025年前三季度营收12.15亿港元,同比增长30%[2][3] 其中资产运营收入7.83亿港元,同比增长16% 资产融通板块收入4.32亿港元,同比增长66%[3] * 归母净利润4.88亿港元,同比上涨22%[2][3] * 截至2025年9月30日,总资产达163.4亿港元,资金储备充足[2][4] * 公司宣布一项10亿元股份回购计划,执行期为2025年11月17日至2028年12月31日,以反映对公司价值及未来发展的信心[2][4] **二、 机器人产业布局与进展** * **全链条投资策略**:投资策略分为“北派”和“南派”[8] “北派”关注机身智能产业链,包括本体端、材料端和零部件端[8] “南派”关注消费类机器人及C端应用场景[8] 投资原则是“只投最好的企业”[2][8] * **具体投资案例**:已投资核心零部件公司权志博(关节模组)和触觉传感器公司墨镜科技[2][8] 上游成立了首程机器人先进材料有限公司,专注于核心材料研发[5] 高自由度灵巧手、减速器、伺服系统等上游核心零部件领域尚未布局[23] * **线下体验店**:已在北京首钢园、首都机场T3航站楼(永久店)及成都春熙路(快闪店)开设三家机器人科技体验店[5][10] 十一期间北京两家永久店平均每日进店人数达1万人,日销售额约10万元[3][10] 计划2026年按批次在全国核心城市开设更多体验店[2][3][10] 体验店定位为利润中心,期望未来几年增加营收并逐步盈利[18] 已签约六十多家机器人公司作为代理商,30%到50%的选品来自正在看的投资项目[35] * **线上渠道**:推出线上“首创W”直播间,首日GMV超过两万元,第三天因双十一活动达五万多元[27] * **合作与场景应用**:与阿尔特汽车签署战略合作协议,共同推动机器人和汽车应用新业态发展[2][5] 与万兴科技合作在成都环贸ICD打造全国首个机器人家自动充电快闪体验店[6][7] 在园区和停车场等基础设施场景中开放给科技企业进行联合研发,例如支持因时机器人的巡检类产品[15] * **技术观点与展望**:认为VLA(视觉、语言、动作)模型是未来基本范式[3][12] 看好全身遥操作技术可能成为双足人形机器人的突破点[20] 预计2026年有四到五家被投机器人企业可能上市[3][11] 认为2025年是机器人应用元年,技术进步带来实际订单,长期发展势头强劲[37] **三、 基础设施领域布局与进展** * **资产投资与退出**:2025年第三季度完成北京核心区域一个租赁住房项目投资,并积极储备京津冀、华东、成渝、大湾区四大核心区域的优质资产[2][6] 通过资产证券化、公募REITs等手段实现退出[2][6] * **基金合作**:与中国人寿共同成立规模100亿元的平准基金(首期资金52.7亿元),投资数据中心及清洁能源项目,如南方两个数据中心的REITs和华电清洁能源REITs[2][6][25] * **运营表现**:基础设施运营板块(含停车、园区业务)呈稳健增长趋势,是公司重要底气和提质增效载体[13] 停车业务从2024年开始只做核心资产项目,提质增效效果明显,强化了核心领域相对垄断地位[13] 园区业务通过招商、物业管理及成立商管公司扩大收入品类和管理规模[13] * **投资收益**:基础设施投资收益率接近30%[3][13] 国内首支瑞士平准基金自2025年4月24日成立以来已投了四五个项目,收益率接近30% Price基金现管理规模为200亿元[13] * **行业观点**:认为REITs是解决房地产危机的终极方案,公司对REITs行业前景充满信心[33] 在停车场增值服务上表现出色,包括充电桩、广告收入等,已成为中国停车场增值服务领域的领导者[33] **四、 资本结构、股东回报与未来展望** * **股东回报政策**:制定了三年分红回报计划,董事会通过政策,到2027年每年的分红不低于当年净利润的80%[14][30] 回购计划设定为三年10亿,是基于可持续性和预测性的战略安排,保证公司有充足现金捕捉战略机会[31] * **资本运作**:2025年进行了增发,包括可转债(CB)和配售[16] 可转债资金主要用于新业务拓展,配售资金用于开设机器人体验店[17] 目前不缺资金,账上有85.5亿元现金和其他可变现资产,如有好机会会考虑直接收购[45][47] * **市值与沟通**:当前市值176.26亿元,没有具体的市值管理目标,而是致力于持续为投资人创造价值[45] IR团队致力于开放透明地与市场沟通[45] * **团队与激励**:管理层平均年龄不到45岁,中层管理人员平均年龄不到40岁,团队充满活力[41] 注重员工激励,包括股权、薪资奖金等[41][52] * **模式构建**:基础设施资产循环模式已基本完成 科技资产循环模式的构建处于第二年阶段,预计需五年时间,会根据市场反馈调整策略,例如从B端计划转向能快速占领市场心智的C端机会[51]
智驾软硬件持续迭代,robotaxi未来已来
2025-11-03 10:35
行业与公司概览 * 纪要涉及的行业为智能驾驶(智驾)行业,包括高级辅助驾驶(L2/L2+)和全自动驾驶(L4/Robotaxi)领域 [1] * 纪要重点讨论的第三方智驾软件供应商包括Momenta、华为、大疆(卓翼)、地平线、元戎启行 [3] 市场格局与公司能力 * Momenta在第三方智驾市场占据领先地位,份额达55%,华为占25% [1][3] * Momenta提供单Orin X和双Orin X两种方案,覆盖从比亚迪、智己到奇瑞等不同车型,展现其工程化和算法裁剪能力 [1][3] * 华为凭借强大的体验和工程化能力,支持多款车型、自研芯片及大规模路侧泛化,但其顶尖算力芯片目前主要用于ADS 4.0 Ultra版本 [3] * 大疆在低算力芯片(如TI TDA4)解决方案上工程化能力出众,但市场对低算力芯片(32 TOPS或100 TOPS以下)的需求正在转向中高算力方案 [1][4] * 地平线采用自研软硬一体化方案(如HSD及G6P系列),已在奇瑞星途车型上量产,但受限于NPU算力及迭代升级,整体效果仍需提升,需更多车型验证工程化能力 [1][6] * 元戎启行主要集中在城市NOA,基于英伟达平台开发并与长城汽车合作紧密,其算法开发能力领先但工程化能力相对较弱 [7] 技术路线与核心观点 * 当前智驾行业技术路线主要分为三类:端到端算法(代表企业有Momenta、特斯拉、极氪)、VLA模型(代表企业有理想、小鹏)以及世界模型(华为、Momenta、地平线等正在开发) [2] * 车企智驾能力差异主要由算法、数据和算力三大因素决定,短期内算法调整效果明显,长期来看数据积累是关键,高效训练依赖强大计算资源 [8][9] * 长期看,若厂商继续沿用当前技术路线(如Transformer),智驾能力差异将逐渐收敛,数据积累达到一定规模(如特斯拉的50亿英里)后会出现数据饱和效应 [10] * 在感知硬件路线上,融合感知路线(结合激光雷达)比纯视觉更具长期优势,原因包括激光雷达成本已降至200多美元、数据处理技术提升能应对复杂场景、新法规对障碍物检测提出更高要求 [12] * L2+公司向L4发展更具优势,过渡自然且资源投入较少,但挑战在于全域泛化能力和量产一致性 [1][20] 芯片架构与发展需求 * 下一代智能驾驶芯片需求包括:强大的GPU/NPU以支持VLA和世界模型等高级功能、高带宽(未来可能需要从当前290GB/s翻倍或增至1.5倍)、工艺与功耗平衡(如3纳米或5纳米)、增加内存容量 [14][15] * 不同级别自动驾驶的算力需求:L2级需5-10 TOPS,增加泊车功能需约16 TOPS;L2++(高速辅助驾驶)需30-100 TOPS;L3级需500 TOPS以上;L4级普遍认为需1,000 TOPS以上 [16] * 对于L3及以上级别,冗余设计变得重要,例如采用双Orin芯片配置以备未来升级 [16] * 智能驾驶芯片与机器人芯片平台差异不大,许多厂商借鉴共用平台以降低成本 [17] Robotaxi商业化前景 * Robotaxi市场是一个正能性市场,不完全依赖技术驱动,关键在于提高场景内车辆通行效率和减少远程接管及事故率 [18] * 实现盈亏平衡需区域扩展足够大且定价合理,主要成本来自车辆折旧(如小马智行第六代车成本高达60万人民币),可通过定制化、换电等方式降本,同时需确保价格竞争力和扩大行驶里程覆盖范围以提高收入 [19] 其他重要细节 * VLA技术对智能驾驶体验的提升主要集中在功能创新(如自动前进/后退)和对带有语义信息的环境理解能力上,提高了决策合理性和流畅性 [11] * 大多数第三方算法公司(如Momenta、元戎启行)更倾向于开发通用算法并进行跨平台适配,而非与特定芯片厂商深度绑定,软硬件耦合较深的主要是同时提供软硬件解决方案的公司(如华为、地平线) [13]
字节发布全新 VLA 模型,配套机器人化身家务小能手
搜狐财经· 2025-07-24 00:51
GR-3模型技术亮点 - 具备高泛化能力,能理解抽象语言指令并操作柔性物体,通过少量人类数据即可高效微调[2] - 采用改进模型结构,可处理长程任务并实现高灵巧度操作,包括双手协同和全身操作[2] - 采用三合一数据训练法,融合遥操作机器人数据、人类VR轨迹数据和公开图文数据[7] - 采用MoT网络结构,将视觉-语言模块与动作生成模块结合为40亿参数端到端模型[7] - 计划扩大模型规模和训练数据量并引入RL方法,提升泛化性突破模仿学习局限[7] ByteMini机器人特性 - 专为GR-3设计的通用双臂移动机器人,具备22个自由度和无偏置7自由度机械臂[4] - 机械臂采用球形手腕设计,可在狭小空间完成精细操作[4] - 搭载多颗摄像头实现细节与全局感知,配备全身运动控制系统[4] - 作为GR-3的配套躯体,能高效处理真实环境中的复杂任务[4] GR-3实际应用表现 - 在超长序列餐桌整理任务中展现高鲁棒性和成功率,严格遵循分步指令[4] - 能准确判断无效指令并保持不动,如处理不存在的物品指令[4] - 可控制双臂协同操作柔性物体,鲁棒识别整理不同摆放方式的衣服[5] - 能泛化抓取未见物体,理解复杂抽象指令如处理未训练过的短袖衣物[5] 行业技术发展趋势 - 泛化能力成为VLA模型研发重点,助力机器人在复杂场景快速适应新任务[7] - 机器人公司持续发力"机器人大脑"端,推动VLA模型技术进步[7]