Workflow
VLA大模型
icon
搜索文档
长假八天,智驾进入“大乱斗”
36氪· 2025-10-16 09:01
过去的这个国庆长假,交通出行有多疯狂,智驾品牌就有多安静。 一份来自央视网的报道显示,这个十一期间,平均每天有1250万辆新能源汽车从路上飞驰而过,这一数据比去年同期增长30%,较平日增长70%。 庞大的出行需求,带来了复杂的交通场景,也成为检验智驾产品效果的绝佳契机。 截至目前,头部新能源车企中,除华为、小米外,大部分品牌的信息发布渠道中,已经看不到智驾的相关战报。 与之相对应的是,新能源行业用另一则大消息,标定了智驾赛道前线烽火的方位。 公开资料显示,十一假期结束后的首周,小鹏、蔚来智驾团队均出现重大人事、组织架构调整,涉及多位高管变动,其中,小鹏智驾业务更是直接换帅, 李力耘不再担任自动驾驶中心负责人,世界基座模型负责人刘先明接替该职位。 战报哑火、高管更替,一静一动之间,从2024的"智驾元年",到2025的"全民智驾元年",短短两字之变背后,属于这一赛道的游戏规则,已经悄然发生了 更迭。 1、全民智驾元年,行业换了种玩法 从战报声量的消退,到业务团队的调整,一个直观的趋势已经显现: "智驾元年"到"全民智驾元年",行业拼的不是普及率、渗透率的数字游戏,而是技术层面的"刺刀见红"。 也正因如此,过去几 ...
通信产业锚定“碳硅共生”新阶段
证券日报· 2025-10-13 00:00
大会概况与主题 - 2025中国移动全球合作伙伴大会于10月10日至12日在广州召开,已连续举办13年 [1] - 大会主题为“碳硅共生合创AI+时代”,勾勒出通信产业的破壁之路 [1] - 中国移动董事长杨杰表示AI将持续释放技术能力和经济效益的“两个规模效应”,推动全球形成“人机共治”新模式 [1] AI+应用场景落地 - 中国移动展示无人餐厅方案,其人形机器人具备点对点取餐送餐、规划复杂路线及多机协同能力 [2] - 公司自研VLA大模型赋予机器人跨物体、跨场景的泛化操作能力,并构建业内首创多机并发作业平台 [2] - 公司正在推动机器人养老院场景试点,并已在车企中进行“AI+柔性产线”解决方案的小批量生产试用 [2][3] - “中移无障碍”通信解决方案通过构建用户专属语音识别模型,提升对听障人士语音的识别准确率 [3] 合作伙伴与产业协同 - 参会企业结构从传统通信产业链扩展至AI、算力、行业融合解决方案等多元化领域 [4] - 智元创新公司展示多款机器人产品在工业、商业、家庭等场景的融合应用能力 [4] - 亚信科技展出采用“边缘具身智能+AIAgent+P5G”技术方案的叠衣机器人 [4][5] - 中国信科与中国移动共同推动星地网络融合,并在低空领域、跨洋高速传输场景推出创新解决方案 [5] - 电科金仓展示新版KESV9数据库产品及全生命周期自动化信创替换解决方案 [5] AI基础设施投入与规划 - 中国移动宣布到2028年底对AI领域总体投入翻一番,建成国内规模最大、技术领先的智算基础设施 [7] - 公司计划探索十万卡智算集群建设,全国产智能算力规模目标突破100EFLOPS [7] - 2024年公司算力网络投资总额达371亿元,通用算力规模8.5EFLOPS,智能算力规模29.2EFLOPS [7] - 2025年算力投资计划从371亿元增至373亿元,对推理资源投资不设上限 [7] - 公司已实现国家算力枢纽节点全量覆盖,建设哈尔滨、呼和浩特两个超万卡智算集群及12个千卡资源池 [7] 算力技术进展与生态趋势 - 华鲲振宇展示与中国移动联合研发的“磐石”系列服务器及浸没式液冷方案 [7][8] - 其哈尔滨国产万卡资源池项目拥有超1.8万张AI加速卡,智能算力规模达6.9EFLOPS [8] - 新华三技术公司展示H3C UniPoD系列超节点产品,单柜内实现卡间全互联通信以支撑万亿级参数大模型 [8] - AI技术落地呈现“场景垂直化”趋势,预计对“千卡、万卡”级算力需求激增,需构建分布式可调度算力网络 [8] - 未来AI产业生态将走向“开放共生化”,是算力供应商、运营商与场景方的协同 [8] 公司未来战略方向 - 中国移动首次披露“十五五”规划,将以“AI+”为战略着力点 [9] - 公司计划扮演好AI“供给者、汇聚者、运营者”的角色,推动“AI+”创造更大经济效益和社会价值 [9][10]
华为、蔚来重金押注WA世界模型!这才是未来辅助驾驶的发展方向?
电动车公社· 2025-10-03 23:58
WA世界模型的技术原理 - WA世界模型概念源于20世纪40年代苏格兰心理学家肯尼思·克雷克提出的"心智模型",通过模拟物理规律理解世界并做出决策[9][11][12] - 2018年DeepMind发表《World Models》论文,提出通过自动编码器压缩现实场景数据,利用神经网络推演未来可能性,再通过控制器执行动作的"造梦"训练模式[17][18][19] - 世界模型采用类似"训狗"的奖励惩罚机制,通过设定物理参数和规则框架让AI在试错中进化[24][26] - 2022年后借助ChatGPT等大模型的序列建模能力,世界模型从2D升级到3D仿真,可推演多因素叠加的复杂场景[26][28] - 核心目标是让AI具备人类式的物理时空理解能力,通过因果逻辑预演行动后果[29] WA世界模型在自动驾驶领域的应用 - 华为和蔚来是明确采用WA世界模型技术路线的代表企业[6] - 蔚来技术可实现分析前3秒行车数据,0.1秒内推演120秒模拟路况,生成216种场景可能性[32] - 华为ADS 4系统分为云端WE(World Engine)世界引擎和车端WA(World Action Model)世界行为模型,合称WEWA[37][39][40][41] - 系统内置多专家模块,如路口预测专家和拥堵跟车专家,根据不同场景调用专用算力资源[56][57][58] - 车端算力需求较低,通过注意力热图实现局部算力聚焦,降低延迟提高反应速度[54][55][59] WA世界模型与传统端到端及VLA的对比 - 相比传统端到端模型,WA世界模型增加预判环节,运行速度更快[33][34] - 解决端到端黑箱问题的手段不同:VLA通过图像转文本实现可视化修改,WA通过三维物理规则反向演算配合注意力热图回溯问题根源[44][45][48] - 数据训练优势明显,云端世界引擎可虚拟生成极端事故场景数据,突破真实数据稀缺限制[50][51][52] - 与VLA技术路线差异:WA依赖"肌肉记忆"经验式反应,车端系统更精简;VLA接近人类逻辑思考,擅长处理突发危险场景和复杂长尾决策[62][63][64][65] - 硬件需求侧重点不同:VLA对车端芯片算力要求高,WA更依赖网络速度和芯片带宽[68] 行业技术路线发展态势 - 当前辅助驾驶技术处于分水岭阶段,WA与VLA路线各有拥趸[69][70] - 长期可能走向技术融合或出现新架构,实现优势互补[71] - 技术发展最终目标为推动L3、L4级自动驾驶落地[72][73]
一汽收购卓驭科技35.8%股权,后者前身为大疆车载事业部
第一财经· 2025-09-23 12:54
股权交易 - 一汽收购卓驭科技35.8%股权 交易后一汽与New Territory分别持股35.8%和34.85% 双方共同控制公司[1] - 交易前一汽未持股 New Territory持股70.65%并单独控制公司 交易后一汽成为最大单一股东[1] - 卓驭科技在交易后保持独立运营[1] 公司背景 - 卓驭科技前身为大疆车载事业部 2016年成立 2023年从大疆分拆独立 2024年6月启用卓驭品牌[2] - 公司属于"地大华魔"头部智驾企业之一 即华为/Momenta/地平线/大疆[2] - 2022年在宝骏KiWi EV(10万元级)量产首套辅助驾驶方案 实现自适应巡航/车道保持/拨杆变道/自主泊车等功能[2] - 2023-2024年在10万级车型实现无图高速领航与城市记忆领航[2] 业务现状 - 合作车企包括大众/上汽通用五菱/奇瑞/一汽/东风/长城 但未带来巨大规模和市场声量[2] - 2024年4月合作车企增至9家 新增比亚迪/奥迪/北汽 量产车型近20款 开发中新车型超30款[3] - 发布基于英伟达Thor平台的VLA大模型 该技术为行业前沿 理想/小鹏等企业也在押注此技术路线[3] 战略影响 - 股权深度绑定一汽有望加快量产落地速度[3] - 市场关注深度绑定一汽是否影响与其他车企合作[3]
中科院院士冷劲松:人形机器人的“身体”革命
经济观察报· 2025-09-20 17:55
具身智能产业发展路径 - 产业界存在两种不同发展路径:一种是以优必选、智平方为代表的企业聚焦人工智能大模型技术投入商业和工业场景 另一种是以冷劲松院士团队为代表的从底层智能材料入手重构机器人"身体"的路线 [1][3][18] "身体"革命:智能材料创新 - 冷劲松团队研发的智能材料可根据电、磁、光、热等外界激励主动改变形状、软硬和功能 目标替代传统电机成为未来机器人"肌肉" [2][10][11] - 智能材料柔性太阳能帆板已成功应用于商业卫星 实现国际首次作为主电源在轨展开 将传统"炸、弹、锁"三步展开流程简化为单一平稳动作 [5][7][8] - 智能材料在工业制造领域应用:新能源汽车碳纤维储氢气瓶制造中使用可变形模具 解决异形芯模取出难题 [9] - 生物医疗领域应用:可降解智能高分子材料制作心血管支架 两年后自行降解吸收 降低长期血栓风险 [10] - 其他应用场景包括:根据湿度变化的智能服装 自适应车速的汽车外形 自动升降的应急防洪坝 可重复擦写盲文纸 [10] "大脑"竞速:AI算法与感知系统 - 智平方与惠科子公司达成合作 未来三年将部署超过1000台VLA大模型驱动的具身智能机器人进入半导体显示生产基地 [2][14] - VLA大模型通过端到端数据驱动实现"从感知到行动"自主能力 解决传统机器人柔性作业难题 采用人形轮式设计适配现有工厂环境 [14] - 优必选获得2.5亿元具身智能人形机器人采购合同 为全球人形机器人领域最大合同 Walker系列累计获得近4亿元合同 [14][15] - 优必选百亿参数多模态大模型Thinker在微软、谷歌等机构发起的三大国际机器人权威测试中获得四项全球第一 [2][15] - 帕西尼公司聚焦触觉感知系统 自研高精度阵列式触觉传感器 建立具身智能数据采集工厂 [15] - 帕西尼全模态数据集"OmniSharing DB"在北京国际大数据交易所上架 成为可流通的标准数据资产 [15] 产业发展现状与挑战 - 中国在变形智能材料基础研究论文数量全球最多 但产品化方面可能在未来五到十年被日本和德国公司抢占先机 [16] - 产业面临共同挑战:如何将技术优势转化为具备成本效益和长期可靠性的商业化产品 [18]
理想、小鹏重金押注VLA大模型!“天才”还是“傻瓜”?
电动车公社· 2025-09-20 00:05
技术路线分化背景 - 特斯拉去年年初上线端到端后引发行业快速跟进 推动城市领航辅助功能普及 [3] - 当前辅助驾驶技术路线出现分化 主要形成VLA视觉语言动作模型和WA世界模型两条路径 [4][5] VLA技术路线代表企业 - 理想汽车全量推送VLA司机大模型 并宣称辅助驾驶从"局部领先"进入"全面领先" [7][8] - 小鹏汽车通过自研图灵芯片明确VLA路线 并强调"只有小鹏是真VLA" [12][13] - 奇瑞 吉利 元戎启行等企业也已明牌采用VLA技术路线 [15] WA技术路线代表企业 - 华为明确表示不会走VLA路径 认为WA才是实现真正自动驾驶的路径 [16] - 蔚来汽车同样选择WA技术路线 [21] - 宇树科技创始人质疑VLA为"相对傻瓜式架构" 引发行业讨论 [18][20] VLA技术原理与优势 - 工作原理:将传感器信息转化为语言文字 再通过语言大模型进行逻辑推理后输出动作 [30][32] - 解决端到端架构可解释性差的问题 工程师可直接修改描述文字进行纠错 [37][50][51] - 增强系统交互能力 支持通过语音指令控制车辆动作 如"向左转"或"找车位停"等 [56][57] - 提升复杂场景处理上限 通过类人思考做出更拟人化决策 [63][64] - 理论上有助实现从L2向L3 L4级自动驾驶突破 [87] VLA技术挑战 - 架构复杂度增加 需投喂大量数据训练才能体现体感差异 [74][75] - 对算力要求极高 需要大算力芯片支持实时分析 [77][80] - 小鹏自研图灵芯片已装车 理想自研M100芯片单颗算力据称可达3颗英伟达Thor-U [82] - 需要更大资金与技术投入 软硬件要求均高于传统端到端架构 [84][87] 行业技术发展现状 - 目前所有企业仍处于L2级辅助驾驶阶段 能力不足是重要制约因素 [42] - 最后5-10分的性能提升最为困难 但却是实现更高级别自动驾驶的关键 [43][44] - VLA技术不仅限于车端应用 在AI机器人等领域也有拓展潜力 [70][71]
理想汽车(2015.HK):2025Q2毛利保持韧性 VLA规模化部署在即
格隆汇· 2025-08-31 03:04
财务表现 - 2025Q2单季营收302.5亿元 同比-4.5% 环比+16.7% [1] - 汽车业务收入288.9亿元 同比-4.7% 环比+17.0% [1] - 归母净利润10.9亿元 同比-0.8% 环比+68.0% [1] - non-GAAP归母净利润14.6亿元 同比-2.7% 环比+43.8% [1] - 汽车业务毛利率19.4% 同比+0.7pct 环比-0.3pct [1][2] - 经营性利润8.3亿元 利润率2.7% 同比+1.3pct 环比+1.7pct [2] - 平均售价由26.6万元降至26.0万元 [2] 销量与产品结构 - 2025Q2交付11.1万辆 同比+2.3% 环比+19.6% [1][2] - L6占比46.8% L7占比23.8% L8占比13.3% L9占比13.0% Mega占比3.1% [2] - 其他业务营收13.6亿元 同比+0.1% 环比+9.0% [2] 成本与费用 - 研发费用28.1亿元 同比-7.2% 环比+11.8% 费用率9.3% [3] - 销售管理费用27.2亿元 同比-3.5% 环比+7.4% 费用率9.0% [3] - 经营活动现金净流出30亿元 自由现金流-38亿元 [3] 基础设施与网络 - 零售中心530家覆盖151城 售后维修中心511家覆盖222城 [3] - 超充站2,902座 充电桩15,945根 覆盖255城 [3] 未来展望 - 2025Q3预计交付9.0-9.5万辆 同比-41.1%至-37.8% [4] - 2025Q3预计收入248-262亿元 同比-42.1%至-38.8% [4] - 纯电SUV i6计划9月发布 起售价25万元 续航720km [4] - VLA系统9月覆盖增程AD Max车型 11月有重大更新 [4] - 预计2027年实现L4自动驾驶 [4] 长期预测 - 预计2025-2027年收入1,272.1/1,780.4/2,009.5亿元 [4] - 预计同期归母净利润50.1/114.1/145.5亿元 [4]
理想汽车 | 2025Q2:毛利保持韧性 VLA规模化部署在即【民生汽车 崔琰团队】
汽车琰究· 2025-08-30 22:56
财务表现 - 2025Q2单季营收302.5亿元,同比下降4.5%,环比上升16.7% [2][3] - 汽车业务收入288.9亿元,同比下降4.7%,环比上升17.0%,环比增长主要因交付量增加 [3] - 归母净利润10.9亿元,同比下降0.8%,环比大幅上升68.0% [2] - non-GAAP归母净利润14.6亿元,同比下降2.7%,环比上升43.8% [2][5] - 汽车业务毛利率19.4%,同比提升0.7个百分点,环比下降0.3个百分点 [2][5] - 汽车业务毛利56.1亿元,同比下降1.3%,环比上升15.1% [5] - 经营性利润8.3亿元,利润率2.7%,同比提升1.3个百分点,环比提升1.7个百分点 [5] - non-GAAP净利润率4.8%,同比提升0.1个百分点,环比提升0.9个百分点 [5] 销量与定价 - 2025Q2总交付量11.1万辆,同比增长2.3%,环比增长19.6% [2][3] - 平均售价(ASP)从2025Q1的26.6万元下降至26.0万元,主要因产品组合变化、利息补贴和销售激励增加 [3] - 销量结构:理想L6占比46.8%,L7占比23.8%,L8占比13.3%,L9占比13.0%,Mega占比3.1% [3] 业务细分 - 其他业务(含配套服务)营收13.6亿元,同比增长0.1%,环比增长9.0%,主要因汽车累计销量增加带动服务需求 [4] 费用与投入 - 研发费用28.1亿元,同比下降7.2%,环比上升11.8%,研发费用率9.3%,同比下降0.3个百分点,环比下降0.4个百分点 [6] - 销售管理费用27.2亿元,同比下降3.5%,环比上升7.4%,费用率9.0%,同比上升0.1个百分点,环比下降0.8个百分点 [6] - 截至2025年6月30日,零售中心覆盖151个城市共530家,售后维修中心覆盖222个城市共511家 [6] - 截至2025年7月20日,超充站达2,902座,充电桩15,945个,覆盖31个省份、255个城市 [7] 现金流 - 2025Q2经营活动所用现金净额30亿元,自由现金流为-38亿元 [8] 未来展望 - 2025Q3预计交付量9.0万至9.5万辆,同比下降41.1%至37.8%,对应收入248亿元至262亿元,同比下降42.1%至38.8% [9] - 纯电SUV理想i6计划9月发布,定位中大型5座,起售价25万元,续航最高720km,搭载VLA大模型,面向年轻消费群体 [9] - VLA系统9月起覆盖所有增程车型AD Max版本,9月底推送完整版,11月有重要更新,预计2027年实现L4自动驾驶 [9] 盈利预测 - 预计2025年收入1,272.1亿元,2026年1,780.4亿元,2027年2,009.5亿元 [10][12] - 预计2025年归母净利润50.5亿元,2026年114.1亿元,2027年145.5亿元 [10][12] - 对应2025年8月29日股价,PE估值分别为36倍、16倍、12倍 [10][12]
何小鹏,上了马斯克的贼船?!
电动车公社· 2025-08-29 00:01
全新小鹏P7市场表现 - 全新小鹏P7上市7分钟内获得1万台大定订单 [2] - 对比参考:小米SU7去年上市时1万台大定用时4分钟,小鹏MONA M03去年上市时1万台大定用时52分钟 [4] 技术路线转型 - 公司从激光雷达支持者转变为纯视觉路线坚定支持者 [13] - 公司认为视觉系统上限远超激光雷达,预计2027年自动驾驶技术路线之争将消失 [13] - 与特斯拉马斯克技术路线趋同,均认为激光雷达会降低安全性 [15][16] 纯视觉方案优势与突破 - 纯视觉方案过去表现不佳主要因算力不足,图像像素点阵和帧率不足导致决策困难 [29][30] - 当前算力较以往提升10倍,预计5-10年后算力将再提升10倍 [31] - 算力提升使纯视觉方案在夜间、大逆光、雨雪天等复杂条件下超越人眼感知能力 [33] 自研芯片技术优势 - 自研图灵芯片单颗有效算力相当于三颗英伟达Orin X芯片 [38] - 20万级小鹏G7 Ultra版搭载3颗图灵芯片,车端有效算力达2250TOPS,远超同级产品(多数仅100TOPS) [38] - 自研芯片算力利用率更高,专为自家产品优化,避免通用芯片的功能冗余 [41] - 自研算力领先行业3-10倍,支持功能代际跨越 [43] VLA辅助驾驶系统进展 - 全场景VLA辅助驾驶系统可实时识别水坑深度、行人位置、公交车盲区等复杂场景 [47] - 预计2024年底辅助驾驶能力将比第一阵营强10倍以上 [49] - 支持L4级自动驾驶车型计划2026年量产,并试点Robotaxi运营 [49] 财务与运营表现 - 最近一年半销量相当于过去9年总和 [56] - 2025年二季度总交付量超10万台,创历史新高,同比增长241.6% [56] - 总营收182.7亿元人民币,创历史新高,同比增长125.3% [56] - 毛利率17.3%,同比增长3.3个百分点,现金流475.7亿元人民币 [56] 行业竞争与战略定位 - 与特斯拉在Robotaxi领域可能面临直接竞争,双方均计划2026年扩大规模 [51][52] - 公司未来不排除通过合作方推进Robotaxi商业化运营 [54] - 公司发展聚焦"科技"和"颜值"两大核心方向 [57] - 行业尚未形成稳定格局,存在挑战与机遇并存局面 [60]
新一轮智驾PK,迈入实战时刻
虎嗅APP· 2025-08-27 21:37
新一轮智驾竞赛集中爆发原因 - 监管加强和舆情事件拖后部分公司既定节奏[10] - 各家公司智驾技术底层依赖AI创新突破 时间起点相近[10] - AI底层技术套用于智驾需大量训练和调整 时间周期相对固定[10] - 公司担忧竞对优先发布技术 选择先发布基础版再优化策略[10] VLA模型技术突破 - VLA模型去掉规控时代多环节划分 实现从传感器到控制端单一完整模型[7] - 模型底层从CNN升级为Transformer 大幅提升对人类大脑模仿学习能力[7] - VLA模型下限已超过端到端模型上限 未来持续优化[6] - 相比VLM模型 VLA增加历史状态输入并输出可执行动作 应用于机器人控制和人机交互等领域[8] 思维链能力提升 - VLA通过语言媒介模仿人类思考模式 将驾驶决策分解为连贯推理步骤[11] - 分步推理提升复杂路况处理可靠性 例如识别校车后减速并检测儿童横穿风险[15] - 决策依据以可理解语言展现 增强系统可解释性和事故追溯能力[15] - 模型通过海量数据学习推理逻辑 获得泛化能力处理未知新场景[15] 实际道路表现 - 在立交桥下辅道人车混行场景 持续自我推理并将车速降至绝对安全范围[16] - 视线被遮挡路口感知对向电瓶车时 决策从控速升级为主动降速预留反应空间[18] - 丁字路口汇入前提前分析识别 降速后再汇入车流避免被迫变道[20] - 复杂十字路口综合天气和行人动态推理风险 以缓慢安全方式通过[22] 行业发展趋势 - VLA模型成本差异主要在芯片 15万元以上车型可适配 10万元级别车型通过优化有望搭载[26] - 智驾芯片将加强对Transformer支持 尤其在FP4和FP6精度算力优化[26] - 自研辅助驾驶系统需经历规则算法、端到端1.0到VLA过程 无法完全跳过发展阶段[26]