世界模型
搜索文档
李飞飞3D世界模型爆火后,国内首个免费版来了:我当了回「为所欲为」的造物主
36氪· 2025-12-22 17:21
腾讯混元世界模型1.5产品发布 - 腾讯混元团队上线了国内首个开放体验的实时世界模型TencentHY WorldPlay 1.5 [1] - 该模型能够根据用户输入的文字或单张图片,生成一个可供实时操控和探索的3D虚拟世界 [1] 核心功能与技术亮点 - 支持文字生成世界,用户通过文字描述可生成如过山车、千禧年跨年夜等多样化的3D场景 [2][4][11] - 支持单图生成场景功能,可将如《千里江山图》等图片转化为可游览的3D空间,并保留原艺术风格 [14][16] - 具备实时交互生成能力,通过原创的Context Forcing蒸馏方案及流式推理优化,模型能以24 FPS的速度生成720P高清视频 [7] - 通过重构记忆机制实现长范围的3D一致性,支持分钟级内容的几何一致性生成,用于构建高质量3D空间模拟器 [7] - 采用流式DiT架构,能够边接收用户实时控制信号边生成画面,保证了极低的操控延迟 [21] - 模型支持实时文本触发事件,用户可通过一句话指令在5秒内平滑改变世界状态,如让天色从亮变暗 [17][19] 产品体验与效果 - 文字生成场景的等待时间约为5-8秒 [4] - 生成的场景具有高写实度,例如过山车场景中皮肤纹理、金属划痕等细节清晰可见 [4] - 在千禧年场景等测试中,模型对三维空间有较好理解,物体能保持相对位置关系,无明显漂移 [11] - 在处理大跨度视角切换时,如海景房场景,窗框、立柱等直线条未发生扭曲,展现了良好的三维空间一致性 [13] - 目前模型在处理第一视角高速运动场景时存在挑战,可能生成静态的“定格瞬间”以供细节观察 [9] - 在复杂场景中,近处物体的细节可能缺乏锐利边缘,呈现“AI粘滞感”或类似油画的柔软效果 [11] - 实时物理模拟尚存瑕疵,例如爆炸后近处水面未能呈现波动效果 [21] 行业意义与未来展望 - 世界模型代表了从语言智能向空间智能的关键发展,旨在让AI理解并操作三维物理世界,是通往通用人工智能的关键一步 [23] - 该领域获得全球科技公司如Google、Meta、OpenAI及腾讯的重点关注与投入 [23] - 该技术使艺术从“被欣赏”变为可“自由游览”,为内容创造与交互提供了全新范式 [16] - 尽管当前在流畅度和交互深度上仍有提升空间,但世界模型赋予了用户创造世界的自由,具有广阔的未来想象空间 [25]
硅谷停电干崩谷歌Robotaxi,马斯克贴脸热嘲:特斯拉就没事
36氪· 2025-12-22 17:09
事件概述 - 旧金山变电站火灾导致大规模停电,约13万居民用电受影响,交通信号灯失灵 [1] - Waymo自动驾驶出租车(Robotaxi)因此全面停摆,车辆停在路中造成拥堵,公司需调用拖车移走车辆并暂停当地服务 [1] - 特斯拉CEO埃隆·马斯克迅速回应,称特斯拉Robotaxi未受此次停电影响,引发公众对两种技术路线的比较 [1][7] Waymo运营与技术分析 - 官方解释停运原因为:车辆将失效红绿灯视为停车标志并停下,但大范围停电导致无线信号不佳,远程安全员无法连接车辆进行接管 [4] - 公司技术博客透露,其自动驾驶算法已转向“世界模型”路线,通过模拟环境补充数据训练,但此前未对交通灯失灵场景进行针对性训练 [4] - Waymo当前车队规模超过2500辆,在Robotaxi玩家中领先,但车辆分散于各城市,收集的真实场景数据有限 [4] 特斯拉的进展与市场影响 - 摩根士丹利预测,特斯拉Robotaxi车队规模将在2026年突破1000辆,2030年超过3万辆,2035年达到100万辆 [10] - 特斯拉在加州已注册1655辆车用于激活FSD(完全自动驾驶能力)的网约车服务,通过人机共驾收集数据,反哺其Robotaxi业务 [10] - 随着特斯拉在奥斯汀开启无人运营,投资机构开始重估其自动驾驶业务价值 [10] - 马斯克在社交媒体上的相关回应获得超过6万点赞,许多网友认为FSD历经数十亿公里数据验证,能更好处理异常情况 [9] 行业竞争格局演变 - 自动驾驶竞争主要围绕“特斯拉路线”(L2渐进式)与“Waymo路线”(L4终局式)展开 [1] - 行业对数据有限的共性问题,已形成转向“世界模型”的共识 [4] - 中国公司如Momenta、元戎启行、地平线等也在2024年重注Robotaxi,出行平台纷纷推出相关服务 [11] - 行业竞争加剧,2026年被视为自动驾驶“战国时代”的开端 [11]
全自研仿真GPU求解器x虚实对标物理测量工厂,打造具身合成数据SuperApp,加速具身仿真生态丨光轮智能@MEET2026
量子位· 2025-12-22 16:01
文章核心观点 - 具身智能的发展正从大模型的“语言世界”迈向“物理世界”,而仿真正成为连接两者并实现落地的底层基础设施[1] - 具身智能的市场规模和数据机会远大于文本、视觉模型及智能驾驶,其数据维度更真实、复杂,潜在规模是大语言模型的1000倍[2][10][14] - 具身智能时代的核心挑战在于数据,仿真是解决数据问题的唯一可行方案,其关键在于解决仿真真实性(Sim2Real)的行业痛点[3] - 光轮智能通过自研“测量、生成、求解”三位一体的全栈仿真基础设施,为具身智能提供数据、训练、评测的全流程解决方案,旨在成为支撑产业规模化发展的基础[3][6][12] 行业趋势与市场机会 - 具身智能的数据机会预计是大语言模型的1000倍,源于其需要处理力反馈、逻辑电路、阻尼等多维复杂物理交互,远超智能驾驶(主要是视觉和车辆动力学)的数据复杂度[10][14] - 具身智能的预训练数据需求巨大,因为缺乏“本体在跑”的真实数据,而真机数据采集面临成本高昂、易损坏、场景单一和“Real2Real”差距等挑战[17][18] - 传统仿真方法因物理不真实、资产视觉失真、交互行为不准确三大问题,导致仿真与真实世界差异巨大,部署成功率从理论100%降至5%[15][19][20] 光轮智能的仿真技术解决方案 - 公司自研了“测量、生成、求解”三位一体的仿真基础设施,以解决Sim2Real的可靠性问题[3][15] - **测量**:通过自研设备实现自动化物理测量,建造“虚实对标物理测量工厂”,不再依赖猜测和经验[21][24] - **生成**:核心是生成系统,确保资产、场景、力的反馈与真实世界100%对齐,覆盖钢体、铰链、流体、可形变物体等,并主导制定了行业规范LW-Ready[23][24][25] - **求解**:自研了全栈GPU Solver,支持百万级自由度的实时求解,实现多物理场耦合,物理精度达亚毫米级,更新频率达千赫兹[23][36][38] 仿真应用与生态构建 - 公司认为仿真平台的成功离不开生态支撑,因此聚焦打造“爆品应用”来验证和优化平台[15][39] - **仿真遥操数据采集工厂**:建立了全球最大的遥操数据采集工厂,运用6D鼠标、AR、VR等多种采集方式,并配备自动化质检与标注[6][40] - **大规模RL训练平台(LW-BenchHub)**:可在高仿真环境中运行成千上万的并行仿真实例,进行24小时不间断训练,并能自动生成极端、长尾场景以增强机器人鲁棒性[6][42][44] - **工业级机器人评测平台(RoboFinals)**:行业首个针对前沿机器人模型的工业级评测平台,包含一百项涵盖家居、工厂、零售等真实场景的任务,已成为全球使用频次最高的仿真应用之一[6][45] 公司业务与客户进展 - 公司成立于2023年,商业化进展迅速,已服务全球具身智能和世界模型领域的头部客户[12] - 客户包括英伟达、DeepMind、Figure AI等国际公司,以及国内字节、阿里等科技企业,还包括丰田、吉利等场景应用方[12] - 公司与学术界合作紧密,其自研仿真工作流已成为Hugging Face官方指定的仿真环境[13] - 公司通过仿真技术帮助客户将机器人本体真正地Sim2Real落地到实际工厂中[12]
赵何娟独家对话李飞飞:“我信仰的是人类,不是AI”
新浪财经· 2025-12-22 13:27
行业趋势与展望 - 空间智能(世界模型)预计将在未来两年内迎来应用级爆发 [1][5][21] - AI发展正从“语言生成”迈向“世界生成”,让机器在连续三维世界中实现“看见-生成-互动” [4][5] - 世界模型正成为产业竞逐的新高地,Google DeepMind等巨头已组建专门团队并发布相关路线 [5] - 生成式AI通过降低复杂任务的门槛,将开启许多意想不到的新市场和应用 [23][24] 公司进展与产品 - World Labs发布了首款商用“世界模型”Marble,可从图片或文字提示生成可持续存在、可自由导航且几何一致的3D世界 [2][4] - Marble模型可导出为Gaussian Splat等格式,支持在网页与VR设备中体验与二次创作,突出了“更大、更清晰、更一致”的特点 [4] - World Labs自2024年获巨额融资以来,始终以开发大型世界模型(LWM)为愿景 [6] - 公司认为3D世界生成技术可应用于数字创意、游戏开发、影视、设计、建筑、VR/AR及机器人仿真等多个领域 [23] 技术路径与瓶颈 - 实现通用人工智能(AGI)需要多把“钥匙”,空间智能是其中关键一环,没有它则不算真正的AGI [25] - 当前发展面临数据瓶颈,这是螺旋形上升过程中的新关键点,与算法同等重要 [31][32][33] - 业界存在一种偏见,即更看重算法而非数据,但所有真正做AI的人都明白数据至少与算法平等重要 [34][35] - 机器人领域的数据尤其难以采集,因为缺乏大规模商业化应用场景,这限制了其发展 [43][47] 竞争格局与市场机会 - AI是一项横向技术,为应用层提供了大量机会,大公司无法完全覆盖,小公司有机会在垂直应用领域做到极致 [54][55] - 显性资源(如数据、算力、人才)的整合优势并非绝对,创造力、时机和执行同样关键,历史上从未有过只有大公司能赢的时代 [53][54] - 有能力开发基础模型的公司(通常需要顶尖人才和特定结构)与专注于应用开发的公司将有不同的市场路径 [55][57] 应用场景分析 - 自动驾驶可被视为一个简化版的世界模型,但其场景相对简单(二维移动、避免碰撞),远复杂于未来需要在三维世界中执行多种操作(如家务)的机器人 [40][41] - 工业机器人因场景单一、数据相对丰富而已有应用,其智能化进程可能更快;日常用机器人的商业化则还有较长的路要走 [44][45][47] - 围绕机器人数据(如模拟数据)的创业公司存在商业机会,但成功取决于市场大小和满足客户需求的能力 [47] 发展理念与价值观 - AI的本质是工具,人类必须掌握选择权和主动权,不能自我放弃 [1][4][70] - 发展的同时必须关注安全与向善,在只追求发展和只强调伦理两个极端之间需要理性平衡 [57][58] - 在AI时代,教育体系急需革命,应利用AI赋能教育者和学生,将节约出的时间和精力用于培养AI无法替代的认知与能力 [65][66][67] - 面对AI可能带来的虚假信息等负面影响,公众教育、制度政策以及人的创造性应对至关重要 [77][78][79]
旧金山“黑夜迷途”:一次停电暴露自动驾驶单车智能的当下困境
钛媒体APP· 2025-12-22 12:38
事件概述 - 2025年12月20日,旧金山发生大规模停电,导致约12.5万用户断电,覆盖近三分之一区域,交通信号灯熄灭,公交停运[1] - 在此次事件中,Waymo自动驾驶车队出现集体“宕机”,多辆车辆在十字路口停滞不前,导致交通堵塞,次日公司承认并暂停了旧金山服务[3][5] 技术脆弱性分析 - 事件暴露了L4级自动驾驶系统在外部数字基础设施崩塌时的系统性脆弱链,并非单一模块故障[5] - 自动驾驶依赖多传感器融合,但停电导致交通信号灯物理消失,摄像头在低照度下识别能力骤降,系统失去了关键的“规则锚点”[5] - 系统决策严重依赖预设规则和格式化场景,面对信号灯失效后需视为“All-Way Stop”的混乱人类行为博弈时,其决策算法陷入高不确定性下的保守死循环,无法确认100%安全便不行动[5][6] - 伴随停电可能出现的蜂窝网络波动或实时数据中断,切断了车辆与远程协助中心的联系,使车辆成为“信息孤岛”,无法获取后台指令[6] - 系统的硬件冗余无法弥补“环境模型”的缺失,其“最小风险状态”策略(原地停车)在单车场景下合理,但在车队规模部署时引发了系统性交通堵塞[7] 数据与算法的根本问题 - 行业专家李飞飞指出,当前AI存在“算法比数据重要”的认知偏差,但数据至少具有同等价值,Waymo事件是“协同失灵”的典型案例[9][10] - Waymo每周提供45万次Robotaxi服务,累计路测里程达数亿英里,但数据高度集中于“正常工况”,对于“全域大规模停电”这类低概率、高成本的系统性边缘场景,训练集几乎空白[10] - 更深层问题是当前系统缺乏一个能理解物理与社会规则如何动态演化的“世界模型”,现有系统只是感知-预测-规划的流水线拼接,没有因果推理和心智理论,当输入异常时无法调用常识进行降级决策[10] - 李飞飞比喻,数据和算法就像两条腿,Waymo有强大的算法之腿,却在关键数据维度上跛足前行[11] 行业解决方案与未来方向 - 未来1-2年AI的突破口在于数据与算法的新型协同机制,自动驾驶行业需进行数据战略的范式革命[12] - 行业必须放弃对总里程的迷信,转而系统性构建关键场景数据库,包括通过定向实采、众包上报与仿真生成相结合的方式积累“黑暗场景”[13] - 利用生成式AI与数字孪生技术,可在虚拟环境中反复模拟复合边缘场景,生成海量训练样本,高质量合成数据可显著提升模型鲁棒性[13] - 数据标注需从传统目标检测升级为对意图、因果关联和社会规范建模的“高阶语义数据”,以训练世界模型[13] - 需降低对云端、高精地图和实时通信的过度依赖,发展更强的边缘智能,训练数据应包含大量“通信降级”条件下的成功处置案例[14] - 国内企业如蘑菇车联正实践自研大模型与AI网络结合的方案,通过端到端训练构建统一认知框架,并利用覆盖车端、边缘与云端的分布式基础设施形成数据闭环,以应对类似挑战[14] - 未来的自动驾驶系统应从“规则拟合者”进化为能深度理解物理世界、揣摩人类意图、在不确定性中稳健决策的“世界理解者”[16]
智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式
机器之心· 2025-12-22 12:23
文章核心观点 - 一篇由多所顶尖高校及研究机构团队发布的综述,首次从架构集成的视角,系统性地将世界模型融入具身智能系统的现有研究划分为三大范式,并探讨了其核心优势与未来发展方向 [5][7][8] - 引入世界模型能解决传统反应式具身智能系统缺乏前瞻性和泛化性差的瓶颈,为智能体带来样本效率提升、长程推理能力、安全性增强及主动规划能力 [10][11][12] - 世界模型与策略模型的耦合强度可从梯度流动和信息依赖两个独立维度衡量,并据此形成从弱到强的模块化、顺序化、统一化三大架构范式 [15][16] - 未来研究将聚焦于表征空间的选择与融合、生成结构化意图、确保想象的可达性与物理一致性,以及探索统一的世界-策略模型构建范式 [27][28][29] 世界模型的核心价值与引入原因 - 传统端到端反应式方法面临两大瓶颈:缺乏前瞻性,无法预测未来状态以处理长程规划任务;泛化性差,难以适应未见过的环境或任务配置 [11][12] - 世界模型的思想源于人类认知科学,通过构建能预测未来的内部模型,使智能体获得“想象”能力,从而提升样本效率、长程推理能力、安全性及主动规划能力 [10][11] 三大架构融合范式 - **模块化架构**:世界模型与策略为独立、互操作的弱耦合模块,无梯度流动,策略输出不依赖未来状态;世界模型作为“世界模拟器”,让智能体能在内部根据动作预演未来,以判断动作的可行性、风险与长远收益 [15][16][20] - **顺序架构**:世界模型与策略为中等耦合,采用两阶段梯度传递;世界模型作为“决策生成器”,首先生成一个有价值的未来目标状态,将复杂任务拆分为目标生成与目标条件执行两个子问题,简化后续控制 [15][16][21][22][23] - **统一架构**:世界模型与策略融合为一个端到端的强耦合网络,在同一个损失目标下联合优化;网络在同一条计算路径中同时预测未来状态和输出动作,无需显式区分“模拟”与“决策”步骤 [15][16][24][25] 未来研究方向展望 - **表征空间选择与耦合**:需平衡视觉空间的语义丰富度与状态空间的高效紧凑,未来趋势是通过统一潜变量融合二者,为跨任务泛化奠基 [27] - **结构化意图的生成与表达**:世界模型应生成可解释的未来结构(如目标、轨迹、因果等),并与语言和符号推理结合,以显式刻画任务分解、物体关系与因果依赖 [27] - **想象对智能体脆弱性的指导**:需引入可达性判别、可行性过滤、物理一致性评估来降低想象目标超出本体能力的失效风险;同时需权衡模块化解耦带来的可解释性与终端性能最优性 [28] - **统一的世界-策略模型构建范式**:需探索如何将大规模预训练模型以最小代价转化为统一决策系统,关键难点在于状态空间对齐、表示粒度选择及避免表征偏置 [29]
速递|Yann LeCun(杨立坤)新公司AMI Labs聚焦“世界模型”,寻求超50亿美元估值融资
Z Potentials· 2025-12-22 11:40
公司创立与核心团队 - 知名AI科学家Yann LeCun证实创办新公司“高级机器智能”,其本人担任执行董事长,而非首席执行官 [1] - 公司聘请医疗转录AI明星企业Nabla的联合创始人兼首席执行官Alex Lebrun担任首席执行官 [1] 融资计划与估值 - 公司在正式启动前,计划以30亿欧元(约合35亿美元)的估值募集5亿欧元(约合5.86亿美元)资金 [2] - 此估值在知名AI科学家创业的背景下被认为并不特别惊人,例如前OpenAI CTO Mira Murati创立的公司种子轮估值达120亿美元 [2] 技术方向与行业定位 - 公司正在开发“世界模型”AI,作为大语言模型的替代方案,旨在理解环境、模拟因果关系以预测结果,并试图解决大语言模型的结构性幻觉问题 [3] - 世界模型是行业前沿方向,Google DeepMind和李飞飞创立的World Labs等顶尖实验室和初创公司也在开发 [3] - 相较于同行,公司的融资目标被认为更为大胆,例如World Labs在2024年8月以10亿美元估值募集了2.3亿美元 [3] 关联公司Nabla动态 - Nabla公司正在寻找新任首席执行官,过渡期间由联合创始人兼首席运营官Delphine Groll临时负责 [4] - Nabla已与公司签署合作协议,未来将部署使用公司开发的模型 [4] - Nabla已累计融资1.2亿美元,包括2025年6月完成的7000万美元C轮融资,投资者包括LeCun、Tony Fadell的Build Collective基金等 [6] - Nabla首席执行官Alex Lebrun背景深厚,在Nuance Communications从事过早期技术研发,创立并出售过两家自然语言处理初创公司,并曾主管Facebook人工智能部门 [6] - Nabla目前增长态势良好,其年度经常性收入在2025年增长了三倍多,即将突破10亿美元 [7]
研究生实验到什么程度可以写小论文?
自动驾驶之心· 2025-12-22 11:23
公司业务与服务模式 - 公司提供针对学术论文发表的辅导服务,旨在帮助用户在有限时间内高效产出科研成果,避免自主写作的常见问题 [2] - 服务覆盖期刊论文、会议论文、学位论文(毕业论文),以及课题和项目,提供全方位的学术支持 [8] - 服务以结果为导向,配套代码提升指导,并提供持续的服务保障,全程陪伴直至论文中稿 [8] 目标客户与用户痛点 - 目标客户包括面临论文发表压力的研究生、博士生,以及有科研需求的在职人员 [1][7] - 用户常见痛点包括:研究方向不清晰、研究想法(idea)难产、代码复现困难、实验跑不通、论文写作障碍、缺乏系统科研训练与导师反馈 [5] - 用户可能陷入追求过高创新性(novelty)而忽视项目完整性的误区,导致进度拖延 [1] 服务领域与专业方向 - 服务专注于人工智能与自动驾驶相关的前沿技术领域,具体方向包括:端到端学习、视觉语言模型(VLA)、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅(3DGS)、鸟瞰图(BEV)感知、占据网络(Occupancy Network)、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配(Flow matching)、点云感知、毫米波雷达感知、单目感知、车道线/在线高精地图等 [3] - 公司支持用户自带课题或研究方向进行咨询 [3] 师资力量与资质 - 所有辅导老师均保证来自全球QS排名前100的大学或机构 [6] - 师资人均拥有多篇顶级会议(A会)论文发表经验,且项目经验丰富 [6] - 公司承诺老师简历真实可查,合作后用户可要求查验 [6] 服务成果与案例 - 公司展示了过往学员的成功案例,涵盖从本科大三到博士五年级的不同阶段学员 [7] - 案例成果包括在SCI期刊(2区、3区)、CCF推荐会议(B类、A类)、以及各类顶会(如CVPR, emnlp)上发表论文 [7] - 服务周期通常在2至4个月之间,例如有学员在2个月内于NEUROCOMPUTING(2区)发表论文,或在4个月内于CVPR(顶会)发表论文 [7] 附加价值与承诺 - 除了论文发表,公司承诺为优秀学员提供清华大学、北京大学、麻省理工学院(MIT)等名校的推荐信,并推荐至实验室实习 [11] - 表现突出的学员可直接获得内推机会,进入如阿里巴巴达摩院、华为诺亚方舟实验室等企业研发岗位 [11] - 公司强调其务实风格,承诺只说实话、做实事,不会夸大或打鸡血,会认真听取用户情况后提供可行路径 [3] 服务定价与入门门槛 - 服务收费根据目标论文的分区(如SCI分区、会议等级)不同而定价,公司会根据用户具体情况和发文目标提供详细报价 [11] - 公司声称零基础用户也能发表论文,通过提供基础课程,让用户从文献带读学起,若踏实跟进,可在6个月内完成一篇小论文 [11]
回望2025·实物见变迁丨车轮上的新体验——2025年汽车“智变”里的科技跃迁
新华社· 2025-12-22 09:37
文章核心观点 - 2025年中国汽车产业完成了从“电动化”到“智能化”的赛道切换 智能驾驶技术正从技术验证加速转向场景落地 并以前所未有的速度普及和升级 为消费者带来全新的驾驶体验 同时行业也进入了以用户体验和成本控制为核心的激烈洗牌阶段 [1][2][3][5] 智能驾驶普及现状与消费者体验 - 2025年前三季度 具备组合驾驶辅助功能(L2)的乘用车新车销量同比增长21.2% 渗透率达64% 即每卖出10辆新车中有超过6辆具备基础智驾能力 [1] - 智能泊车、车道保持等驾驶辅助功能已成为越来越多车型的标配 相关场景从演示变为日常体验 甚至不到10万元人民币的车型也已配备 [1] - 消费者对智能驾驶的接受程度明显提高 在试驾或选择配置时会主动提及 关注点已从单一高速场景转向应对城市拥堵、路口博弈等城区复杂路况 [1][2] - 智能驾驶为消费者带来便利与安全体验提升 例如自动刹停避让盲区危险、在长途或堵车时接替重复操作等 [1] 高级别自动驾驶技术突破与落地 - 2025年 L3(有条件自动驾驶)和L4(高度自动驾驶)级别技术接连迎来突破 工信部已附条件许可两款L3级自动驾驶车型产品 [2] - 中国首块L3级自动驾驶专用正式号牌“渝AD0001Z”在重庆诞生 安装在深蓝汽车产品上 于重庆市内部分路段开展上路通行试点 [2] - 在北京、上海、广州、深圳等地 通过手机App呼叫无人驾驶Robotaxi已成为部分通勤族的出行选择 用户接受度从好奇尝鲜转向常态化使用 [2] - 2025年成为L3级自动驾驶从元年走向实质性落地的关键年份 高级别自动驾驶试点加速扩围 带动Robotaxi车队规模和运营范围进一步拓展 [2][3] 技术发展与成本趋势 - 端到端大模型、视觉语言动作模型(VLA)、世界模型等前沿技术在2025年接连实现突破 [3] - “轻地图”、“无图”技术方案成熟度大幅提升 为智能驾驶的规模化普及奠定了基础 [3] - 智能驾驶硬件成本正以每两年减半的速度快速下探 而智驾体验有望实现两年十倍的提升 推动智能辅助功能逐渐成为车型标配 [3] 行业竞争格局演变 - 智能驾驶市场在2025年迎来从“技术验证”加速转向“场景落地”的关键拐点 [3] - 行业正进行一轮严酷的洗牌 只有具备技术实力和量产经验的企业才能留在市场中 [4] - 未来市场竞争重点将实质性转向用户体验、成本控制、产品生态体系等领域 [5] - 市场结构将呈现显著的分层与专业化特征 预计未来将由少数具备全栈技术研发能力、软硬件垂直整合优势以及大规模数据闭环生态的领先企业主导 [5]
李艳:透过“AI泡沫”之争,看何为历史必然
环球网· 2025-12-22 07:02
文章核心观点 - 当前围绕“AI泡沫”存在激烈争论,反映了技术变革初期资本、技术和产业认知的碰撞,AI产业可能经历泡沫阵痛,但技术进步大趋势不可逆转 [1][5][6] 市场表现与估值争议 - 资本市场出现估值与业绩背离,“美股七姐妹”如微软、英伟达的上涨更多依赖AI叙事驱动,而非扎实盈利支撑 [1] - 美国AI行业资本支出与收入比高达6:1,显著高于铁路泡沫时期的2:1和互联网泡沫时期的4:1 [1] - 行业存在“闭环买卖”模式加剧估值虚高担忧,例如英伟达投资xAI后,xAI随即购买英伟达芯片;微软投资OpenAI后,OpenAI承诺采购巨额微软云服务 [1] - 甲骨文股价近乎腰斩,桥水基金减持AI龙头股,引发市场震荡 [1] 支持AI长期发展的论点 - 主要大国围绕AI积极进行战略级布局,决定了AI投入的长期性与稳定性 [2] - AI应用已从ToC向ToB延伸,日益丰富的应用场景不断延伸其价值链条 [2] - 新旧GPU处于“跑满”状态,反映出旺盛的真实需求 [2] - AI头部企业前期投入巨大,但自身具有强劲造血能力支撑,且未来盈利前景向好,评估需留足“时间跨度” [2] - 谷歌TPU芯片对外供货产生“鲇鱼效应”,打破英伟达GPU垄断,推动算力生态多元共生,并基于自身商业生态构建“算力底座”与“核心模型”,商业前景巨大 [2] 技术路线分歧与竞争 - OpenAI、谷歌等巨头坚持千亿级参数大模型路线,持续投入巨资训练模型 [3] - 前OpenAI联合创始人苏茨克维、杨立昆、李飞飞等人转向“物理AI”、“世界模型”研发,认为当前大语言模型路径是代价高昂的“概率游戏”,难以通往真正的通用AI [3] - 中国DeepSeek通过算法优化走出差异化路线,证明算力并非唯一瓶颈,直接挑战了“GPU堆叠”的路径 [3] - 技术路线分散导致市场难以判断最终胜出路径,资本摇摆放大市场波动 [3] 产业链应用落地现状 - 上游算力硬件因技术壁垒高、需求集中而保持高度景气 [4] - 中游模型层呈现“头部集中、中小挣扎”格局,多数初创企业缺乏商业化能力 [4] - 下游应用层面临叫好不叫座困境,80%部署AI的企业暂时未能实现净利润提升 [4] - 产业链的结构性失衡使投资者对AI产业盈利前景产生分歧 [4] 政策与监管环境 - 各国AI监管政策导向差异显著,缺乏客观统一标准 [4] - 特朗普政府为“松绑监管”,对内出台行政令,对外向欧洲国家施压,以减轻美企合规成本 [4] - 欧盟《人工智能法》强调风险分级监管 [4] - 中国则着力统筹发展和安全 [4] - 政策差异使跨国企业在数据安全、算法透明、伦理规范等方面难以形成稳定预期 [4] 对“AI泡沫”的辩证看法 - AI作为新兴产业,其内在价值难以用传统估值方法衡量,简单套用历史经验判断可能不准确 [5] - 技术与产业初期的泡沫本质上是资本对未来的投票,为技术研发与产业培育提供了必要的资金支持 [5] - AI泡沫的出现是技术从实验室走向产业化的必经阶段 [5] - “挤泡沫”是一个需要时间的过程,市场通过价格波动与竞争机制能挤出虚假需求与低效产能,让真正有技术价值与商业潜力的企业脱颖而出,例如互联网泡沫后谷歌、亚马逊的崛起 [6] - AI泡沫之争的核心是技术变革与资本逻辑、短期利益与长期价值、产业现实与未来预期的多重博弈 [6]