Workflow
世界模型
icon
搜索文档
从“地大华魔”掉队,卓驭科技在智驾平权浪潮下另觅出路
第一财经网· 2026-01-12 18:24
行业竞争格局重塑 - 中国乘用车城市NOA第三方供应商市场高度集中,2025年1~10月Momenta和华为HI合计市场份额超过80%,其他供应商仅占19.2% [1] - 传统“地大华魔”一梯队出现分化,Momenta和华为占据先机,地平线凭借智驾芯片快速扩张软件版图,而卓驭科技出现掉队迹象 [1] - 行业竞争加剧,智能驾驶乘用车渗透率已超68%,高阶智驾方案正下探至10~15万元级别市场,压缩成本、精简团队成行业共识,优胜劣汰趋势明显 [2] 卓驭科技现状与挑战 - 公司主要搭载量仍依赖大众燃油车型,城市NOA主攻纯视觉方案并多搭载于捷途、宝骏等经济型品牌 [1] - 公司过于依赖单一客户大众,虽公布与红旗、一汽大众、哈弗、比亚迪等50多款车型合作,但部分合作车型市场表现不佳,如仰望U8越野玩家版已停售 [3] - 公司以“低成本”控制优势著称,但车企多将其方案用于中低配车型,高配车型需要的高价值功能投入非其所长 [3] - 在低成本赛道面临更多强势玩家挤压,如比亚迪与Momenta合作将高阶智驾下探至10万元级别,地平线计划进入10万元以内市场,华为乾崑ADS 4亦有意下探至15万元级别 [4] - 公司2024年国内ADAS市场份额不足5% [5] - 公司面临生存压力,包括账面资金紧张、原有技术路径对复杂道路环境适应性不足等挑战 [5] 公司技术方案与成本 - 公司7V纯视觉无图城区智驾方案依赖7颗摄像头和1颗高通芯片,实现100TOPS算力,成本约7000元 [5] - 行业目标是将智驾解决方案成本进一步下探至5000元区间,极致成本压缩给供应商带来巨大挑战 [5] 公司新业务拓展 - 为寻求新增长点,公司于2025年底宣布新增重卡和无人物流车业务 [6] - 规划2026年上半年量产搭载其高速NOA的重卡车型,合作企业包括徐工、陕汽、重汽 [6] - 无人物流车将应用于矿山、港口等特定场景 [6] - 新赛道竞争亦激烈,无人物流车领域价格竞争明显,部分产品起售价已降至2万元,并出现“0首付、低利息”等促销方式 [6]
端到端VLA剩下的论文窗口期没多久了......
自动驾驶之心· 2026-01-12 17:20
行业趋势与研究方向 - 自动驾驶前沿研究方向窗口期有限 正被大厂和头部高校激烈竞争[2] - 对于计算机和自动化背景的研究者 深度学习方向如VLA、端到端、世界模型具有从入门到工作及读博的广阔发展空间[2] - 对于机械和车辆背景的研究者 建议从传统PnC、3DGS等算力要求低、入手简单的方向开始学习[2] - 行业前沿研究方向包括端到端、VLA、世界模型、强化学习、3D目标检测、多传感器融合、3DGS、BEV感知、Occupancy Network、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、Flow matching、点云感知、毫米波雷达、单目感知、车道线/在线高精地图等[3] 研究支持服务 - 提供涵盖论文选题、全流程指导、实验指导及申博指导等研究支持服务[6][9] - 服务已成功帮助多篇论文被CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等顶会顶刊收录[7] - 服务覆盖的论文级别包括自动驾驶顶会/顶刊 CCF-A/B/C SCI一区至四区 中科院1至4区 EI/中文核心 以及毕设论文、申博和比赛等[10]
高德扫街榜重磅升级:全球首推飞行实景探店
新浪财经· 2026-01-12 01:16
高德扫街榜产品升级与市场表现 - 上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个“飞行街景”实现从街景到店内实景的俯瞰、推出全球首个应季应时应地的动态生活服务榜单、引入好友关系新增好友动态和个人榜单功能 [2] - 产品已从全国最大美食榜单扩展至“吃喝玩乐”全场景 成为本地生活的超级入口 [2] - 高德宣布免费为100万烟火小店接入飞行街景 旨在应用前沿科技服务真实生活 [2] 用户与商家增长数据 - 高德扫街榜用户规模已突破6.6亿 [2] - 在扫街榜带动下 高德APP单月新增4600万月活用户 月活用户数增至9.96亿 [2] - 上线100天累计吸引86万新商家入驻高德 [2] - 商家订单量环比增长超330% 商家营业额环比增长超270% [2] 技术能力与行业影响 - “飞行街景”是全球首次将世界模型用于普惠生活服务行业 [2] - 高德自研世界模型在国际权威评测基准WorldScore上综合得分位列第一 获全球顶级AI学术界认可 [2] - 相关论文被ICLR 2025、NeurIPS 2025等人工智能顶会收录 [2]
颠覆测绘界!游戏极客改写地图史,谷歌阿里把地图变数字孪生
搜狐财经· 2026-01-11 22:55
地图行业的演进历程 - 地图从静态的纸质或早期电子导航工具,演变为能够理解、预测现实的“数字孪生”和“数字生命”[1] - 行业变革的驱动力并非传统测绘专家,而是来自游戏、搜索和芯片等领域的跨界科技公司[1] 技术革命的起点:从Keyhole到Google Earth - 2001年,由擅长3D图形和游戏引擎的约翰·汉克团队创立Keyhole公司,其核心想法是像操控3D游戏一样在数字地球上自由浏览[3] - Keyhole的技术将海量卫星影像、流式加载技术与主要用于游戏的GPU渲染结合,在拨号上网时代面临巨大技术挑战[3] - 英伟达创始人黄仁勋的投资拯救了资金见底的Keyhole,并指出地图的天花板由算力决定,而不仅仅是测绘精度[5] - 谷歌联合创始人谢尔盖·布林被Keyhole演示震撼,收购后将其发展为Google Earth,并视地图为索引物理世界的终极入口[8] - 谷歌通过推动Ajax等技术,在网页浏览器中实现了地图的“无缝拖拽”体验,并启动了全球街道扫描的“谷歌街景”项目[8] 地图功能的质变与国民级应用 - 谷歌地图从导航工具升级为人类文明的数字档案库,将“实时”与“全景”刻入地图定义,成为国民级应用[10] - 地图的意义转变为索引物理世界的入口,而搜索引擎处理信息世界[8] 中国市场的独特演进与高德案例 - 中国市场城市变化快,外卖、打车、实时路况需求爆炸性增长,地图需应对超高频、超复杂、超动态的本地生活网络[10] - 地图软件从“数字地图”向城市“基础设施”蜕变,深度嵌入商业毛细血管[10] - 以高德地图为例,在被阿里巴巴收购后,其功能扩展为打车平台的调度中枢、外卖订单的履约基石及线下商家的流量入口,远超驾车导航[10] 行业前沿:从“数字地图”到“世界模型” - 高德地图提出“世界模型”概念,标志着行业进入“数字生命”阶段[12] - 过去地图是“拍照片”记录静态信息,现在“世界模型”是“造大脑”,试图理解城市运行逻辑,如红绿灯规律、人潮走向及微观博弈[12][13] - 地图的演进经历了从静态到动态,再到具备预测能力的飞跃[13] - 最精准、智能地重构动态世界“影子”的能力,意味着参与塑造现实世界运行规则的能力[13]
锦秋被投企业Manifold AI流形空间完成超亿元天使+轮融资,国产世界模型让机器人大脑超进化|Jinqiu Spotlight
锦秋集· 2026-01-10 14:13
公司融资与资金用途 - Manifold AI(流形空间)完成超亿元天使+轮融资,由君联资本领投,梅花创投、华为哈勃跟投,老股东英诺基金、锦秋基金、同创伟业持续加注 [4] - 公司在半年内累计已获得数亿元融资 [4] - 所募资金将用于世界模型的迭代和具身大脑的应用落地 [4] 核心技术:世界模型 - 公司自研通用空间世界模型WorldScape,具备单图生成可交互空间的能力 [6] - WorldScape在生成质量、时空一致性、实时性等方面全面对标国外一线世界模型,如Google Genie3、李飞飞World Labs RTFM等 [6] - 公司依托海量物理视频数据预训练,使WorldScape具备强大的通用空间操作交互能力,补齐了世界模型落地到物理AI的最后一块拼图 [8] - 公司坚持World Model Action技术路线,利用自研世界模型作为基础模型替换通用VLM模型,使机器人大脑获得“超进化” [10] 技术性能与成果 - 实测表明,其模型在落地性能上显著超过了pi0.5等经典VLA模型,zero-shot泛化能力大幅领先当前具身模型 [10] - 相关模型即将在社区发布 [10] - 公司是世界范围内首个全域布局室外、室内、空域具身世界模型后训练的团队 [9] - 相关成果DriveScape、RoboScape、AirScape已分别发表在国际顶级会议CVPR2025、NeurIPS2025、ACM MM2025上 [9] - 多个场景的后训练基于同一个世界基座模型WorldScape迭代,提升了数据闭环效率和模型性能上限 [9] 产业合作与部署 - 公司已率先接入NVIDIA Jetson Thor用于具身世界模型的本体部署 [14] - 产业投资人华为哈勃的加入,将有利于提前布局国产化芯片和机器人大脑的集成,奠定规模化落地的基础 [14]
“机器人一次性卖完太亏!”真机智能刘智勇:今年中国本体厂商将大淘汰,拼的是世界模型?
AI前线· 2026-01-10 13:57
文章核心观点 - 视觉语言导航技术范式转变是具身智能领域的关键进展,其零样本泛化能力大幅降低了部署成本,为特定场景的初步普及奠定了基础 [4][5] - 世界模型是解决数据瓶颈和提升机器人长程规划、动态适应能力的关键共识,其因果推理能力的突破被视为未来的技术决胜点 [6][7][16] - 行业预计到2026年将发生整合,中国本体机器人公司可能收缩至5到8家,竞争核心在于单一场景实现不依赖大量售后的净利润,并形成数据飞轮 [2][17] - 具身智能大规模落地仍面临高质量数据稀缺、硬件性能制约以及感知决策延迟等挑战 [9][11][12] - 未来的商业模式创新可能围绕“整机销售+每年服务费”的组合或按单收费展开,以改善现金流并降低用户一次性支付压力 [2][15] 技术进展与范式转变 - **导航范式转变**:技术路线从以SLAM为核心转向基于视觉语言导航的端到端统一范式,代表性工作如UniNavid、ETPNav、FSR-VLN为机器人门到门配送带来可能性 [4][8] - **核心优势**:VLN范式结合语言和视觉实现语义理解,能应对非静态环境,不再依赖预先建图和高规格激光雷达,大幅优化了成本与效率 [4][5][8] - **当前瓶颈**:VLN技术尚未达到极高的导航成功率,且面临感知决策延迟问题,需在端侧做好部署以匹配长程规划和行动频率 [4][12] 世界模型的作用与潜力 - **行业共识**:世界模型被视为解决数据问题的共识,能模拟预测未来状态、预测动态物体轨迹并弥补数据的corner case [6][7] - **现阶段价值**:提升机器人全局规划能力、增强动态环境下的行动安全性、生成数据以减少泛化鸿沟 [7] - **未来突破**:世界模型的因果推理能力若取得突破,将能很好解决机器人的安全性与行为推理安全问题 [7][16] - **现存问题**:世界模型目前主要是黑盒,而非白盒可微,且在开门等任务上可能缺少精准几何信息 [7][12] 数据瓶颈与解决方案 - **数据挑战**:高质量物理交互数据稀缺,现有数据集场景覆盖不足,且VLN数据采集与标注成本高昂,3D数据标注成本比2D图像高出一个量级 [9] - **解决方案**:采用多种数据方案,包括采集真实RGBD视频流与人工标注、利用仿真器批量生成视觉语言轨迹三元组、通过改写人类标注数据生成新样本,以及探索离线轨迹挖掘 [10] 硬件现状与制约 - **能力提升**:灵巧手、一体化关节及触觉传感器使机器人具备开门、按电梯的能力,实现了从轮式机器人到人形机器人的巨大转变 [11] - **主要制约**:需要高分辨率柔性触觉皮肤以提高操作成功率;硬件需应对成千上万种门的泛化场景;电机、执行器等部件的耐疲劳性与反脆弱性不足,在反复操作场景中脆弱性可能被放大100倍 [11][12] 公司战略与落地应用 - **战略重点**:公司分设不同技术路线,其中聚焦VLN与人形机器人的分支,重点方向是实现无需预先建图的零样本泛化门到门配送,以及通过全身运动控制解决开门问题 [13] - **成本目标**:过去部署成本约占整个机器人售价成本的38%,新技术旨在消除此成本 [13] - **应用场景**:结合无需建图的导航与开门能力,目标实现最后五公里的门到门配送,在无GPS信号的室内环境中依靠视觉与语言理解导航 [14] 产业竞争与商业模式 - **行业整合**:预计2026年本体厂商将收缩,马太效应明显,中国最终可能只剩5到8家本体机器人公司,但应用场景与上游企业会更多 [2][17] - **竞争维度**:从追求单点技术先进性转向比拼整体系统效率 [17] - **盈利关键**:核心是在单一场景实现不依赖大量售后成本的净利润,从而形成数据飞轮,推动模型能力提升与跨场景复制 [2][17] - **商业模式创新**:“整机销售+每年服务费”的组合模式被认为优于单纯硬件销售,能保证长期收益并解决售后压力;未来也可能出现按单收费模式,例如人形配送机器人每单成本控制在两到三元人民币 [2][15] 未来能力边界突破 - **2026年突破方向**:一是机器人在非结构化场景中实现稳定作业,需具备社交行为与自主导航能力;二是突破莫拉维克悖论,使机器人能胜任人类觉得简单的事情 [16] - **技术决胜点**:世界模型的因果推理能力被视为关键的技术决胜点 [16] - **中外优势对比**:国际公司在大模型与基础模型技术上更先进,而中国企业拥有供应链成本优势 [17]
何小鹏为高德“飞行街景”上线点赞:将持续探索物理世界与 AI 深度耦合的更多可能
新浪财经· 2026-01-10 12:59
公司战略与技术方向 - 公司董事长公开为高德地图的“飞行街景”功能上线点赞 认为该功能让商家能用手机生成可飞行的实景店铺 是一次体验升级 [1] - 公司认为 高德地图的“飞行街景”是AI深入理解并还原物理世界的重要突破 [1] - 公司认为 世界模型将成为驱动下一代汽车、机器人、飞行汽车的核心技术底座 [1] - 公司将持续深耕物理AI 持续探索物理世界与AI深度耦合的更多可能 [1] - 公司期待与高德地图及同行者一起 在物理AI的道路上走深走实 [1] 行业趋势与认知 - 从出行到生活 行业正共同经历物理AI带来的变化 [1] - AI深入理解并还原物理世界被视为重要技术突破 [1] - 世界模型被公司视为驱动下一代智能硬件(汽车、机器人、飞行汽车)的核心技术底座 [1]
聊一聊AI硬件和软件
傅里叶的猫· 2026-01-09 23:58
文章核心观点 文章认为,近期AI硬件板块市场表现疲软,可能源于对AI数据中心(AIDC)建设速度的担忧,特别是DRAM产能的硬性约束可能限制增长[1][3][7]。与此同时,AI软件/应用领域的发展势头超出预期,受到政策支持、大厂竞争和技术突破的推动,展现出更强的投资吸引力[8][9][10][14]。 AI硬件:增长面临内存瓶颈 - **DRAM产能成为关键制约**:麦格理报告指出,未来两年DRAM行业的新增产能仅能支持约15GW的AI数据中心建设,这可能迫使全球AI扩建计划出现大规模延期与重新调度[3] - **产能约束的替代测算**:有产业研究观点认为,今明两年DRAM产能可支持的数据中心建设规模分别为20GW和33GW,但仍存在不确定性[5] - **数据中心装机量预测**:根据Visible Alpha测算,2025年全球数据中心装机量预计为17.4GW,2026年将增长至30.2GW[5][7] - **GPU出货与功耗激增**:英伟达GPU出货量从2022年的1570千颗(K)预计增长至2026年的9522千颗,单卡平均功耗从381瓦(W)升至1110瓦,导致其GPU出货对应的数据中心总功耗从2022年的0.6GW飙升至2026年的10.6GW[7] - **全球数据中心装机量预测**:基于英伟达GPU功耗及市占率等假设,测算出全球数据中心装机量将从2022年的1.3GW增长至2030年的96.1GW,其中2026年预计为30.2GW[7] - **中美市场占比**:预计到2026年,美国数据中心装机量占全球比例约为60%,对应18.1GW;中国占比约为22%,对应6.8GW[7] - **市场下跌归因**:市场可能将DRAM产能限制解读为AI数据中心增长不及预期的信号,从而导致硬件板块下跌[7] AI软件:政策、竞争与技术驱动发展 - **政策持续加码与精准落地**:国家政策从宏观引导转向精准落地,2025年启动“人工智能+”行动计划试点,2026年初八部门发布“人工智能+制造”专项意见,设定了推动3-5个通用大模型赋能制造业、打造100个工业高质量数据集、推广500个典型应用场景等量化目标[9] - **大厂竞争聚焦入口与生态**:2026年,国内外科技巨头竞争策略灵活密集,核心分两条线:C端聚焦流量入口构建与效率提升(如阿里千问绑定电商账号);B端通过售卖token和布局开发者生态带动云收入(如阿里云通义赋能智能硬件)[10][11][12] - **竞争延伸至实体场景**:ROBOTAXI(机器人出租车)成为新的竞争焦点,Waymo、特斯拉等公司均在加速布局[13] - **技术突破聚焦三大关键词**:2026年AI模型技术演进的核心是世界模型、原生多模态和自进化智能体(记忆)[14] - **原生多模态是突破重点**:其发展分为三个阶段,当前最先进的范式是谷歌实现的端到端统一混合编码解码,国内处于初步探索阶段[15] - **AI应用公司的核心竞争力**:在于技术渗透速度与场景落地效果,通过与现有应用、硬件和系统深度融合,在垂直领域解决实际问题并实现商业化闭环,以此避开与大厂通用大模型的正面竞争[15]
CES观察|能跑跳、能干活、能签单,中国人形机器人站上C位
贝壳财经· 2026-01-09 17:35
行业趋势:中国企业在全球人形机器人领域占据主导地位 - 在CES 2026全部598家机器人相关参展商中,中国企业达到149家,占比接近四分之一 [1] - 在人形机器人展区,38家参展企业中有21家来自中国,占比超过一半 [1] - 行业观点认为,中国人形机器人在品类、供应链和产品性价比上具有优势,且技术转化量产能力强,在工业、商用及家庭陪伴等场景的应用已走在前列,预计2026年将成为行业爆发拐点 [1] 参展企业技术展示与产品应用 - **运动控制技术**:宇树科技通过G1机器人的舞蹈与拳击演示体现高精度扭矩控制与动态平衡技术;众擎T800通过格斗动作展示关节高爆发性与高灵活度技术 [4] - **AI具身智能与场景应用**:智元展示了全系列机器人及在语言交互、舞蹈、酒店服务场景的作业能力,并发布基于大语言模型的开源仿真平台Genie Sim 3.0 [6];星动纪元通过端到端VLA具身大脑ERA-42实现高自由度遥操作与场景自适应交互 [6];北京人形机器人创新中心的具身天工2.0展示了基于跨本体VLA模型XR-1的全自主分拣功能 [6] - **家庭与商用陪伴**:傅利叶GR-3通过“井字棋”对弈和情感化交互展示主动陪伴价值;乐享科技(元点智能)推出从大型通用机器人Jupiter到家庭陪伴机器人M1的全线产品,强调情感联结 [7] 市场拓展与商业落地进展 - 加速进化的Booster K1在展会首日即售出数十台;魔法原子的MagicDog在开业第一天已卖出数条 [8] - 松延动力携“小顽童N2”参展,计划在北美、中东、欧洲、东南亚、日韩五大区域市场于第二季度力争实现千台量级规模的市场拓展 [8] - 北京人形机器人创新中心首次参展CES,旨在国际打造影响力并推动海外布局 [8] 产业链核心部件与技术创新 - **灵巧手**:灵心巧手展示了已量产的高自由度产品Linker Hand L20系列及驱控一体的工业版本 [10];灵巧智能首次参展带来DexHand021 Pro灵巧手,提供22个自由度,价格下探至1.4万至2.8万美元区间,称价格仅为国际同类产品的五分之一 [10] - **感知技术**:帕西尼感知科技展出第三代多维触觉传感器PX-6AX-GEN3,并演示搭载该传感器的机器人完成制作冰激凌等任务 [11] - **基础软件与系统**:极佳视界专注于世界模型方向,指出2026年世界模型主要作为评估器、强化学习环境及在World Action Model方面将有更多进展 [11];睿尔曼智能展示了从关节模组、机械臂到远程作业网络的全链路布局,并完成了从“北京-拉斯维加斯”跨洋实时遥操演示 [11] 行业生态与竞争格局 - 中国机器人供应链企业集中展示核心技术能力与产品输出,标志着产业生态正走向专业化、成熟化 [9] - 全球人形机器人竞赛的下半场不仅是技术比拼,更是工程化、商业化与生态构建能力的综合较量,一个分工明确、效率显著的产业生态正在形成 [12]
马斯克diss英伟达自动驾驶:再等五六年
搜狐财经· 2026-01-09 16:00
文章核心观点 - 英伟达与特斯拉在自动驾驶领域从互补转向直接竞争 英伟达通过发布Alpamayo自动驾驶平台 以开放生态模式赋能车企 而特斯拉则凭借其庞大的真实路测数据与闭环迭代能力构建护城河 双方在技术路线、商业模式和产业生态上展开全面较量[1][5][26] 英伟达的战略与方案 - 发布Alpamayo自动驾驶平台 核心在于提供一套开发范式与基础设施 而非完整自动驾驶系统[7] - 技术核心是首次将视觉-语言-行动模型与思维链推理大规模应用于自动驾驶 旨在实现决策过程的可解释与可调试[7][9][11] - 商业模式为赋能者 提供作为“教师模型”的Alpamayo 1 供车企利用自身数据训练轻量级“学生模型” 避免与客户直接竞争[11] - 配套提供AlpaSim高保真仿真平台及超过1700小时带有因果标注的真实世界驾驶数据集作为训练资源[11] - 其开放平台策略已吸引客户 例如梅赛德斯-奔驰已开始与Alpamayo合作[24] 特斯拉的战略与优势 - 特斯拉对其他汽车制造商推销其FSD完全自动驾驶系统 与英伟达形成竞争关系[5] - 核心优势在于数据规模与真实路测 特斯拉FSD每天行驶里程超过1400万英里 并已开始完全无人Robotaxi测试[16] - 认为实现安全、无人监督的自动驾驶需要约100亿英里的训练数据[16] - 构建了“数据飞轮”闭环:更多车辆上路收集长尾场景数据 驱动模型快速迭代 该闭环建立在全球数百万辆保有车辆基础上[18][19] - 认为依赖仿真与有限路测无法赶上特斯拉 强调规模、数据和迭代是关键[16] 技术路线对比 - 英伟达路线:基于VLA和思维链 试图从外部通过仿真和标注数据构建“解释性推理” 更“白盒”[7][19] - 特斯拉路线:基于纯视觉感知和端到端神经网络 其系统性能提升高度依赖真实世界数据飞轮 更“黑箱”但经过现实锤炼[18][19] - 文章指出 基于信息进行推理并非英伟达独有 华为、蔚来等公司的智驾技术以及理想、小鹏、元戎启行等企业已在相关领域有所布局[13] - 特斯拉FSD本身是VLA和世界模型技术的大融合[13] 竞争本质与行业影响 - 竞争本质是生态位之战 特斯拉作为整车制造商 其“运动员”兼潜在“裁判”身份使其他车企难以采用其FSD方案 因涉及数据主权与供应链风险[24] - 英伟达作为不造车的纯技术供应商 其“赋能模式”让车企掌握数据主权和系统差异化能力 更易被行业接受[24] - 自动驾驶竞争从单车智能比拼 升级为数据生态、开发范式与产业联盟的全面较量[26] - 英伟达赌的是生态的广度 通过开放平台加速整个行业 特斯拉赌的是技术的深度与迭代速度[26] - 文章指出 在英伟达与特斯拉的竞争背后 中国企业在工程底蕴、市场规模和内卷力度上不容忽视[26]