特斯拉下一代AI芯片,将亮相
特斯拉Dojo AI训练计算机进展 - 公司表示其Dojo AI训练计算机正在取得进展,并计划于今年晚些时候上线下一代AI芯片Dojo 2 [1] - 公司认为一项新技术需经过三次重大迭代才能成为伟大技术,Dojo 2已表现良好,但Dojo 3预计将更出色 [1] Dojo超级计算机技术挑战 - 特斯拉AI发布的技术报告指出,Dojo超级计算机正面临制造缺陷和老化导致的静默数据损坏问题 [1] - 与传统系统崩溃不同,这些缺陷不会立即暴露,而是在训练过程中悄无声息地破坏数据完整性 [1] - 一个有缺陷的节点可能导致耗时数周的AI模型训练产生错误结果,或使收敛速度显著放缓 [1] - 这些问题在模型训练完成后几乎无法检测,企业可能在不知情的情况下部署基于损坏数据训练的AI系统 [1] Dojo系统架构与功能 - Dojo是公司设计的超级计算机系统,用作人工智能特别是FSD的训练场,其名称是对武术练习道场的致敬 [1] - 超级计算机由数千台称为节点的小型计算机组成,每个节点拥有自己的CPU和GPU [1] - CPU负责节点的总体管理,GPU则处理复杂任务,如将任务分割成多个部分并同时进行处理 [1]