特斯拉AI芯片战略与产品路线图 - 马斯克官宣AI5芯片步入正轨并重启Dojo 3项目,旨在挑战英伟达[1] - 特斯拉将自研AI芯片的迭代节奏提升至约每9个月一个设计周期,以追赶竞争对手[7] - AI5芯片设计接近完成,AI6处于早期阶段,后续AI7至AI9的蓝图已铺开[9] AI5芯片性能与成本优势 - AI5芯片单颗SoC性能对标英伟达Hopper,双芯组合相当于Blackwell[3] - AI5芯片成本不到英伟达Blackwell的十分之一,能效比高出约3倍[3] - 相较于上一代AI4,AI5总性能提升50倍,内存多9倍,原始算力提升10倍,加固的块量化与Softmax提升5倍[10] - AI5每瓦效率比英伟达Blackwell芯片高2-3倍[12] - AI5由三星和台积电代工,分别采用2nm和3nm工艺[10] Dojo超算项目的演变与整合 - Dojo 1超算基于自研D1芯片,于2023年7月投产并部署[16] - Dojo 2项目因“双轨制”内耗(车端用AI4推理芯片,云端用D1训练芯片)而被放弃[18][19] - 重启的Dojo 3将统一架构,直接使用下一代车载推理芯片AI5及后续芯片搭建计算集群,以整合资源并摆脱对英伟达GPU的依赖[6][19] 特斯拉的底层技术创新 - 公司通过专利“混合精度桥接器”解决高精度计算与低功耗的矛盾,在8位硬件上实现接近32位的计算精度[23][25][26] - 该技术采用对数转换、预计算查找表、泰勒级数展开和霍纳法则,并通过位移技巧使芯片内部有效带宽翻倍[26][27][28] - 创新使自动驾驶系统能精准追踪30秒或更久之前的数据,提升物体恒存性,并通过对数存储KV Cache使内存占用减半、记忆容量翻倍至128k[29] - 引入“注意力汇点”确保神经网络在长时间运行下的稳定性[30] 特斯拉AI芯片的战略使命与部署 - AI芯片为专用芯片,专为特斯拉自家AI软件栈深度优化[7] - AI4芯片旨在让自动驾驶安全性远超人类,并已用于超算建设,在训练系统中与英伟达H100 GPU的使用比例约为1:2(约4万个AI4计算机对比约9万个H100)[12][13] - AI5芯片使命是让汽车性能趋近完美并大幅增强Optimus机器人能力[12] - AI6芯片将专攻Optimus进化和数据中心算力[12] - AI7与Dojo 3的目标是成为部署在太空的算力基座[12] 行业竞争格局与英伟达的领先地位 - 英伟达市值突破5万亿美元,若按GDP排名可位列全球第四大经济体,仅次于美国、中国和德国[33] - 英伟达以约3.6万名员工创造了巨大市值,其效率远超传统经济模式[34] - 英伟达的核心护城河在于CUDA生态,其高粘性软件环境增加了开发者迁移至其他芯片的成本[35] - 英伟达正大举进军“物理AI”领域,即机器人、自动化和工业系统,这与特斯拉的核心业务形成直接竞争[35]
马斯克掀桌复活Dojo 3,AI5性能暴涨50倍,1/10成本把老黄逼入死角