理想谢炎詹锟26年6月16日28个QA(中)

文章核心观点 - 自动驾驶领域的竞争格局正在收敛，全栈自研与在数据、算力等基础环节的“苦功夫”是构建长期护城河的关键[1][2] - 公司自研的“马赫M100”AI推理芯片采用了创新的数据流架构，在性能上宣称领先业界，并计划通过全栈整合与持续迭代来建立竞争优势[2][3][6][7][9][12][14][15] - 自动驾驶技术路径（如从BEV到OCC再到3DViT）的演进并非弯路，而是受算力、硬件等基础设施成熟度驱动的必然过程，未来三年将沿着三维空间建模的路径发展[10][11] - AI推理芯片市场潜力巨大，公司选择优先解决推理问题，并认为数据流架构是更适合AI计算的技术方向[12][13][14] 自动驾驶竞争格局与护城河构建 - 一年前至今，自动驾驶玩家数量已经收敛，许多公司已退出[1] - 自动驾驶是重投入的系统工程，涉及系统、人、技术、算力、平台，短期内难以建立，构成很大壁垒[1] - 构建护城河需参考特斯拉：第一，实现全栈自研（包括算力、芯片、基础设施），以抬高迁移成本[2]；第二，愿意下“苦功夫”，如精细地清洗数据，通过细节积累形成优势[2] - 虽然第一梯队内部差距感觉缩小，但与特斯拉的距离并未缩小，公司计划在年底追上特斯拉以脱颖而出[2] 车企自研芯片的挑战与关键 - 自研芯片并不容易，公司自研芯片耗时4年，在新势力中启动最晚但最快落地，行业一般需要5年或更长时间[2] - 做一颗芯片与做一颗领先的芯片难度不同，最糟糕的结果是做出不领先的芯片，导致投入白费[3] - 衡量自研芯片成功的关键指标包括：全量车型能否使用、能否快速上车、能否运行最先进模型并部署到所有车辆，以及能否持续迭代至第二代、第三代[3] - 公司芯片设计思路独特，无现有IP可遵循，论文显示其方案在全球没有第二家相同[3] 芯片产业链环节与加速可能 - 芯片设计中，偏后端（如生产制造）是成熟环节，可借助供应链加速[6] - 但要实现量产领先，芯片设计与软件必须自研，否则无法迭代性能[6] - 为持续领先，需向产业链深处整合，例如与封装厂进行联合设计，深入封装制造领域[6] 自研芯片的架构特点与通用性 - 公司芯片“马赫M100”是针对端侧AI的推理芯片，其数据流架构可运行任何模型算子，不仅支持自动驾驶，也支持如Qwen 35B（350亿参数）等大型语言模型[6] - 端侧芯片设计重点在于降低延时以服务少数任务，而非像云端芯片那样服务大量并发请求[7] - 芯片编译器要求极高，采用数据流架构，需进行“时间空间编译”，处理大规模并发，与传统冯·诺依曼架构的顺序指令编译完全不同[7][9] - 实现创新需打破软硬件边界，将部分软件功能硬件化，部分硬件功能软件化，以应对摩尔定律放缓的挑战[9][10] 自动驾驶技术路径演进 - 技术演进（如BEV->OCC->3DViT）并非弯路，而是思想随算力、硬件等基础设施升级而逐步应用的过程[10] - 2022年特斯拉BEV方案基于其强大算力实现特征级融合，OCC阶段是将稀疏BEV变稠密，3DViT则是基于三维高斯溅射等新方法的三维空间表示[11] - 未来三年技术路径将基于三维空间建模发展，目标是不用人类预先定义类别，直接投射具有外观、纹理等属性的三维空间[11] - 技术商业化落地需循序渐进，从Mobileye方案到特斯拉FSD的逐步完善即是例证[12] AI推理芯片的市场定位与竞争 - AI算力市场未来将是推理占主导（预计99%），训练只占很小部分，因此推理芯片市场潜力巨大[12] - 公司优先解决推理问题，因为推理芯片需同时权衡成本与效率，且成本敏感度高，这与公司业务目标差距更大，机会也最大[12][13] - 训练芯片追求迭代速度，对成本相对不敏感，公司目前使用市场上成熟的训练芯片[13] 自研芯片的领先性、量产与挑战 - 公司宣称其“马赫M100”芯片性能为世界第一，基准测试显示其性能是英伟达Thor-U的三倍[14] - 芯片从2022年立项到2024年量产上车，用时约4年，速度快于行业普遍的5年周期[14][15] - 开发过程中的挑战主要在于软件、编译器和模型适配，存在大量只有实际动手才能发现的“坑”[15] - 公司不担心架构论文公开导致被复刻，因为从理论到落地有很长的距离，且数据流架构是更适合AI的技术方向，欢迎同行跟随[15] - 动态数据流编译器的难点在于需解决超大规模并行调度问题，类似于管理几十万台计算机集群的通信协作，无中央调度器，这与传统CPU编译有根本不同[15][16]