李想: 全新L9双马赫100芯片有效算力是Thor-U的5-6倍
理想TOP2·2026-02-09 19:07

文章核心观点 - 公司通过自研数据流架构芯片(马赫100)实现了远超行业标杆(英伟达Thor U)的有效算力,并认为“自研算法+自研算力”的软硬一体模式是行业未来趋势 [1] - 芯片算力(TOPS)数值与推理模型精度直接相关,精度越低,标称算力越高,但实现低精度推理需要强大的工程能力 [1][2] - 公司通过采用低精度推理模型(如INT8/FP8混合精度)并计划向FP4优化,以“压榨”出英伟达Thor芯片的更高算力,从而提升智能驾驶系统的反应速度 [2][4][6] 关于公司自研芯片与算力优势 - 公司全新L9车型搭载双马赫100芯片,总算力达2560 TOPS,单颗算力为1280 TOPS [1] - 由于采用数据流架构,单颗马赫100芯片在运行VLA大模型时的有效算力是英伟达Thor U的3倍,双芯片配置的有效算力是Thor U的5-6倍 [1] - 数据流架构相比传统GPU架构具有利用率高、功耗低的优势,具体表现为更高帧率、更短反应时间,能在紧急情况下更早感知风险并更快做出避险动作 [1] - 公司自2022年启动自研,判断2025年起行业将进入“自研算法+自研算力”的软硬一体时代 [1] 关于芯片算力与推理精度的关系 - 芯片算力(TOPS)数值随推理模型精度不同而变化,精度越高TOPS越低,精度越低TOPS越高 [1][2] - 更高TOPS能带来更高模型吞吐率,从而降低推理延迟,使系统反应更快 [2] - 实现低精度推理模型非常考验工程能力 [2] - 以英伟达Thor-U芯片为例,在不同精度下算力不同:FP8精度下为700 TOPS,FP16精度下为350 TOPS,FP4精度下可达1400 TOPS [3][4][6] - 特斯拉的FSD同样采用INT8格式进行推理 [5] 关于公司当前技术路径与未来规划 - 公司目前的VLA模型采用INT8与FP8的混合精度推理,在使用英伟达Thor-U芯片时可实现700 TOPS的算力 [2][6] - 公司未来计划将推理精度逐渐向FP4优化,以“压榨”芯片获取更大算力(Thor-U在FP4下可达1400 TOPS) [2][4][6] - 公司采用的英伟达Thor-X芯片在FP8精度下算力为1000 TOPS,在FP4精度下算力可达2000 TOPS [3][4][6]