文章核心观点 - 自动驾驶领域的竞争格局正在收敛,全栈自研与在数据、算力等基础环节的“苦功夫”是构建长期护城河的关键[1][2] - 公司自研的“马赫M100”AI推理芯片采用了创新的数据流架构,在性能上宣称领先业界,并计划通过全栈整合与持续迭代来建立竞争优势[2][3][6][7][9][12][14][15] - 自动驾驶技术路径(如从BEV到OCC再到3DViT)的演进并非弯路,而是受算力、硬件等基础设施成熟度驱动的必然过程,未来三年将沿着三维空间建模的路径发展[10][11] - AI推理芯片市场潜力巨大,公司选择优先解决推理问题,并认为数据流架构是更适合AI计算的技术方向[12][13][14] 自动驾驶竞争格局与护城河构建 - 一年前至今,自动驾驶玩家数量已经收敛,许多公司已退出[1] - 自动驾驶是重投入的系统工程,涉及系统、人、技术、算力、平台,短期内难以建立,构成很大壁垒[1] - 构建护城河需参考特斯拉:第一,实现全栈自研(包括算力、芯片、基础设施),以抬高迁移成本[2];第二,愿意下“苦功夫”,如精细地清洗数据,通过细节积累形成优势[2] - 虽然第一梯队内部差距感觉缩小,但与特斯拉的距离并未缩小,公司计划在年底追上特斯拉以脱颖而出[2] 车企自研芯片的挑战与关键 - 自研芯片并不容易,公司自研芯片耗时4年,在新势力中启动最晚但最快落地,行业一般需要5年或更长时间[2] - 做一颗芯片与做一颗领先的芯片难度不同,最糟糕的结果是做出不领先的芯片,导致投入白费[3] - 衡量自研芯片成功的关键指标包括:全量车型能否使用、能否快速上车、能否运行最先进模型并部署到所有车辆,以及能否持续迭代至第二代、第三代[3] - 公司芯片设计思路独特,无现有IP可遵循,论文显示其方案在全球没有第二家相同[3] 芯片产业链环节与加速可能 - 芯片设计中,偏后端(如生产制造)是成熟环节,可借助供应链加速[6] - 但要实现量产领先,芯片设计与软件必须自研,否则无法迭代性能[6] - 为持续领先,需向产业链深处整合,例如与封装厂进行联合设计,深入封装制造领域[6] 自研芯片的架构特点与通用性 - 公司芯片“马赫M100”是针对端侧AI的推理芯片,其数据流架构可运行任何模型算子,不仅支持自动驾驶,也支持如Qwen 35B(350亿参数)等大型语言模型[6] - 端侧芯片设计重点在于降低延时以服务少数任务,而非像云端芯片那样服务大量并发请求[7] - 芯片编译器要求极高,采用数据流架构,需进行“时间空间编译”,处理大规模并发,与传统冯·诺依曼架构的顺序指令编译完全不同[7][9] - 实现创新需打破软硬件边界,将部分软件功能硬件化,部分硬件功能软件化,以应对摩尔定律放缓的挑战[9][10] 自动驾驶技术路径演进 - 技术演进(如BEV->OCC->3DViT)并非弯路,而是思想随算力、硬件等基础设施升级而逐步应用的过程[10] - 2022年特斯拉BEV方案基于其强大算力实现特征级融合,OCC阶段是将稀疏BEV变稠密,3DViT则是基于三维高斯溅射等新方法的三维空间表示[11] - 未来三年技术路径将基于三维空间建模发展,目标是不用人类预先定义类别,直接投射具有外观、纹理等属性的三维空间[11] - 技术商业化落地需循序渐进,从Mobileye方案到特斯拉FSD的逐步完善即是例证[12] AI推理芯片的市场定位与竞争 - AI算力市场未来将是推理占主导(预计99%),训练只占很小部分,因此推理芯片市场潜力巨大[12] - 公司优先解决推理问题,因为推理芯片需同时权衡成本与效率,且成本敏感度高,这与公司业务目标差距更大,机会也最大[12][13] - 训练芯片追求迭代速度,对成本相对不敏感,公司目前使用市场上成熟的训练芯片[13] 自研芯片的领先性、量产与挑战 - 公司宣称其“马赫M100”芯片性能为世界第一,基准测试显示其性能是英伟达Thor-U的三倍[14] - 芯片从2022年立项到2024年量产上车,用时约4年,速度快于行业普遍的5年周期[14][15] - 开发过程中的挑战主要在于软件、编译器和模型适配,存在大量只有实际动手才能发现的“坑”[15] - 公司不担心架构论文公开导致被复刻,因为从理论到落地有很长的距离,且数据流架构是更适合AI的技术方向,欢迎同行跟随[15] - 动态数据流编译器的难点在于需解决超大规模并行调度问题,类似于管理几十万台计算机集群的通信协作,无中央调度器,这与传统CPU编译有根本不同[15][16]
理想谢炎詹锟26年6月16日28个QA(中)