Workflow
高效推理
icon
搜索文档
黄仁勋、马斯克就自动驾驶隔空交锋,大摩称特斯拉仍领先数年
搜狐财经· 2026-01-12 18:03
英伟达发布Alpamayo自动驾驶生态体系 - 英伟达CEO黄仁勋在CES 2026展会上公布了名为Alpamayo的完整自动驾驶生态体系,该体系旨在让汽车在真实世界中进行推理,具备类人思考能力 [1] - 该体系包含三个核心部分:行业首个开源的大规模视觉-语言-动作推理模型Alpamayo 1、完全开源的仿真框架AlpaSim、以及包含超过1700小时采集数据的开源自动驾驶数据集 [7] - 该模型能处理视频和传感器输入,应用基于语言的因果推理,生成驾驶轨迹,并解释其决策以实现透明度和安全审计 [7] 技术演示与商业化进展 - 在演示中,搭载该系统的车辆在交通信号灯失灵的路口,能通过多步骤推理(评估左侧来车、右侧行人)自主决策减速观察并安全通过,整个过程无需人类介入 [3] - 首款搭载英伟达全栈DRIVE系统的梅赛德斯-奔驰CLA车型计划于2026年第一季度在美国上路 [3] 行业影响与竞争格局 - 行业认为英伟达Alpamayo体系可能对特斯拉FSD系统构成威胁,但特斯拉CEO马斯克公开回应表示并不担忧 [7] - 摩根士丹利分析师指出,英伟达平台为传统汽车制造商提供了更经济快速的系统改进方式,但使其处于“更快的追随者”地位,而非领导者 [9] - 该机构认为,特斯拉凭借其庞大的车队每天收集数百万辆车的真实驾驶数据用于训练,在自动驾驶领域仍“领先竞争对手数年” [9] 开源策略与市场机遇 - 英伟达宣布将Alpamayo开源,这使得二线车企和新兴品牌能够基于此平台聚焦自身擅长场景进行优化,无需耗费数年打磨基础模型,获得了“弯道超车”的机会 [11] - 该体系的落地将推动行业需求从“暴力计算”转向“高效推理”,车载计算平台的算力与能效将成为新的竞争重点 [11] - 据西南证券测算,2030年中国L3级自动驾驶市场规模有望突破1.2万亿元 [11] 行业支持与核心价值主张 - Alpamayo获得了Lucid、捷豹路虎、Uber和伯克利DeepDrive等移动出行领域领先企业和专家的高度关注 [7] - 黄仁勋表示,“物理AI的ChatGPT时刻已然到来”,机器开始具备理解真实世界、推理并行动的能力,无人驾驶出租车将是最早受益的应用之一 [5] - 行业专家认为,Alpamayo为智能汽车注入推理能力,使其能应对罕见场景、在复杂环境中安全行驶并解释决策,这为安全、可规模化的自动驾驶奠定了基础 [5][7]
NeurIPS 2025 Spotlight | NYU提出QSVD,仅数学压缩让模型更轻、更快、更稳
机器之心· 2025-11-15 17:23
文章核心观点 - 纽约大学SAI Lab提出名为QSVD的创新技术,旨在解决视觉语言模型因参数庞大导致的显存和计算压力问题 [2][3] - QSVD通过“联合低秩分解 + 量化”策略,实现不改变模型架构、无需重新训练的高效压缩,目标为“轻量化而不减智” [7][27] - 该技术在多项评估中展现出显著优势,在极低比特量化条件下仍能保持高精度,推理速度最高提升13倍 [20][22] 技术瓶颈与目标 - 视觉语言模型(如LLaVA-13B)的强大性能伴随巨大资源消耗,推理时Key-Value缓存体积极大,导致速度慢、资源耗尽,阻碍模型落地 [2][6] - 现有解决方案如Grouped-Query Attention等虽能降低计算开销,但存在精度受损或需重新训练的问题 [6] - QSVD的核心目标是实现不改架构、不重新训练的数学压缩,使模型更轻、更快、更稳 [7] QSVD核心思想:联合低秩分解 - 首创联合奇异值分解方法,将Q、K、V矩阵拼接成一个整体后进行SVD,只需一次降维计算即可得到共享的下投影矩阵 [9][10] - 在推理阶段,QSVD仅需缓存一个共享的中间表示,而非分别存储所有的K/V缓存,使显存占用直接减半,尤其在长序列生成中节省显著 [12] - 该方法带来计算更少、显存更省、表示更稳三大优势 [17] 自适应优化与量化技术 - 提出跨层秩分配策略,通过梯度近似计算每个奇异值对模型损失的影响,实现全局最优的压缩配置,避免不同层“一刀切”压缩 [13][14] - 结合后训练量化与异常值平滑技术,引入正交变换矩阵使激活分布更平滑,在4位或8位量化条件下仍保持高精度 [16][18] - 加入可学习参数优化奇异值缩放比例,平衡不同通道间的动态范围,显著降低量化误差 [18] 实验结果与性能表现 - 在LLaVA-v1.5(7B/13B)、LLaVA-Next和SmolVLM等模型上评估,QSVD在FP16精度下比ASVD与SVD-LLM精度高10%以上 [20] - 在W8A8(8位量化)下几乎无精度损失,W4A4极低比特条件下依然稳定工作 [22] - 例如,在LLaVA-v1.5 7B模型上,W4A4量化时QSVD在SciQA任务上保持52.05%的准确率,显著优于对比方法的48.77%或更低 [22] - 推理速度最高提升13倍 [22] 技术实现路径总结 - 通过三个关键步骤实现高效多模态推理:对Q/K/V矩阵进行联合低秩分解;按重要性分配秩的跨层策略;结合旋转量化与异常值平滑的量化技术 [25][26][27] - 该路径可打造出低显存、高精度、快速响应的多模态大模型 [27]