Dojo

搜索文档
特斯拉 Dojo 为何失败?埃隆・马斯克的 AI,梦想与现实的差距!
搜狐财经· 2025-09-12 13:47
埃隆・马斯克过去数年一直着重强调的 AI 超级计算机 "Dojo" 项目,最终还是落下了帷幕。2025 年 8 月,特斯拉正式宣布解散 Dojo 团队,并全面终止该项 目。就在一年前,特斯拉还曾信心满满地表示,将通过第二代 Dojo 在 2026 年实现商业化,然而仅仅几周后,却将其定义为 "进化的死胡同"。Dojo 曾是象 征特斯拉将超越单纯电动汽车制造商、转型为 AI 企业的标志性项目。如今,我们该如何解读这座 "AI 的坟墓"? Dojo 是特斯拉为训练自家自动驾驶神经网络而自主设计的超级计算机,其核心在于特斯拉自研芯片 "D1/D2"。这一构想的初衷,是打造一套不依赖英伟达 GPU、具备更快运算速度与低延迟架构的系统。 马斯克曾通过 Dojo 描绘出一幅宏伟蓝图:特斯拉将凭借 Dojo 完成 "基于视觉的自动驾驶",并将其应用于自动驾驶出租车(Robotaxi)与类人机器人 (Optimus)。通过存储、处理海量行驶影像数据,训练出模拟人类视觉的人工智能 —— 这种技术路径本身就极具吸引力。 但现实却事与愿违。特斯拉未能将自动驾驶的成果与 Dojo 直接关联,芯片性能也始终无法追上英伟达 H100、H ...
Tesla's Dojo, a timeline
TechCrunch· 2025-09-03 00:39
公司战略转型 - 特斯拉旨在从汽车制造商转型为人工智能公司 重点发展自动驾驶技术 [1] - 公司通过定制超级计算机训练全自动驾驶神经网络 以实现从辅助驾驶到完全自动驾驶的跨越 [2] 计算平台发展历程 - 2019年首次提及Dojo超级计算机 专为神经网络和自动驾驶汽车设计定制芯片 [4] - 2021年正式发布Dojo 采用3000片D1芯片与英伟达GPU共同构建AI集群 [9] - 2022年展示Dojo进展 完成首个机柜安装 进行2.2兆瓦负载测试 计划建设7个Exapod集群 [10] - 2023年启动Dojo生产 计划至2024年投入超10亿美元 处理每日1600亿帧视频数据 [13] - 2024年宣布投资5亿美元在布法罗建设Dojo超级计算机 [14] 技术架构演进 - 开发D2下一代训练瓦片 将整个Dojo瓦片集成到单个硅晶圆上 已进入生产阶段 [14] - 德克萨斯超级工厂扩建部分将容纳5万片H100芯片用于FSD训练 [15] - 2024年AI相关支出约100亿美元 其中内部支出占一半 英伟达硬件占训练超集群建设成本三分之二 [15] 计算能力规划 - 2023年预测到2024年2月计算能力进入全球前五 2024年10月达到100 exaflops [12] - 2024年6月AI训练能力约4万片H100等效GPU 预计年底达到9万片等效能力 [16] - Dojo 1预计2024年底具备约8000片H100等效训练能力 [16] 战略重心转移 - 2024年8月推出Cortex超级计算集群 采用约5万片H100英伟达GPU [18] - Cortex助力FSD V13版本实现安全性和舒适性重大提升 数据量增加4.2倍 [19] - 累计AI相关资本支出约50亿美元 包括基础设施投入 [20] 项目终止与团队调整 - 2025年8月解散Dojo团队并关闭项目 团队负责人Peter Bannon离职 [23] - 近20名Dojo员工离职创办DensityAI公司 专注于AI芯片和软硬件开发 [22] - 资源集中到AI6芯片开发 该芯片设计可扩展用于FSD、Optimus人形机器人和高性能AI训练 [23] 未来技术路线 - Dojo 2预计2026年达到规模运营 等效10万片H100计算能力 [21] - 与三星签署165亿美元协议获取下一代AI6芯片 [22] - AI5约18个月后进入大规模生产 现有车辆硬件可能不支持下一代AI模型 [17]
Tesla Dojo: the rise and fall of Elon Musk's AI supercomputer
TechCrunch· 2025-09-03 00:18
项目终止决策 - 特斯拉于2025年8月中旬终止Dojo超级计算机项目并解散团队 项目负责人Peter Bannon离职 另有约20名员工离职创办AI芯片公司DensityAI [10] - 终止决定源于与三星达成的165亿美元AI6芯片供应协议 马斯克称Dojo 2已成为"进化死胡同" 技术路线已收敛至AI6芯片 [11][12] - 公司仍将按原计划向纽约布法罗超级工厂投入5亿美元建设超级计算机 但不再采用Dojo架构 [39][44] 技术架构与性能 - Dojo基于特斯拉自研D1芯片 采用台积电7纳米工艺 单芯片包含500亿晶体管 芯片尺寸为645平方毫米 [27] - 项目原定目标为2024年10月实现100 exaflops算力 相当于27.6万块D1芯片或32.05万块英伟达A100 GPU 但未达预期 [38] - 特斯拉转向Cortex超级集群 2024年第四季度部署约5万块H100 GPU 2025年第二季度新增1.6万块H200 GPU 总算力达6.7万块H100等效 [41][42] 战略定位演变 - Dojo最初被定位为特斯拉实现全自动驾驶、人形机器人和半导体自主的核心基础设施 旨在降低对英伟达GPU的依赖 [3][23][31] - 项目终止标志公司从高风险自主硬件开发转向合作伙伴模式 与英伟达、AMD和三星建立芯片供应关系 [8][31] - 摩根斯坦利曾预测Dojo可通过机器人出租车和软件服务开辟新收入来源 潜在增加5000亿美元市值 [35] 技术挑战与局限 - D1芯片专为计算机视觉训练优化 但性能弱于英伟达A100芯片 且缺乏通用AI训练的软件生态支持 [27][34] - 行业专家指出纯数据驱动方法存在经济性限制 数据质量而非数量才是模型优化的关键 [16][17] - 特斯拉视觉方案依赖全球车队采集的视频数据 需持续处理海量数据以实现人类水平的视觉识别能力 [21][22] 项目历史与投入 - D1芯片于2021年AI日发布 2023年7月进入量产阶段 下一代D2芯片计划采用晶圆级集成技术但未实现 [26][28] - 截至2024年报告显示 公司已为布法罗超级计算机项目投入3.14亿美元 总预算为5亿美元 [39] - 马斯克曾在2024年表示Dojo将在年底达到8千块H100等效算力 但2024年8月起项目宣传全面转向Cortex [40]
特斯拉放弃Dojo对理想的潜在启发
理想TOP2· 2025-08-25 16:18
芯片战略与算力需求 - 特斯拉AI6芯片采用2nm工艺 同时支持车端和云端大集群算力部署 替代原Dojo云端计算芯片[2] - 国家层面存在大算力芯片缺口 寒武纪近期受关注反映该需求[2] - 车端芯片需整合座舱 智驾和域控功能于单一NPU专用芯片 并具备强大软件系统支持能力[2] 生态构建与技术壁垒 - 英伟达核心优势在于CUDA和TensorFlow等计算平台生态 而非单纯硬件能力 可实现跨平台兼容[3] - 寒武纪在软件生态建设方面存在明显不足 硬件层面与华为海思存在较大差距[3] - 理想汽车为榨取Orin芯片性能 可能独立开发底层软件 未直接采用英伟达方案 体现软件能力[4] 技术实现路径 - 理想汽车通过自研编译器及底层系统 实现两个Orin-X芯片协同工作 突破原厂万兆以太网限制[6] - 企业需具备SOC研发 编译器团队和操作系统团队才能实现底层硬件优化[6] - 采用PTX底层编程接口相比CUDA更接近硬件层 需关注具体硬件属性差异[5][6] 行业竞争格局 - 国内互联网巨头如阿里 腾讯 字节缺乏端侧设备布局 芯片设计能力存在不足[2] - 理想汽车若整合芯片设计 软硬件能力和模型能力 有望成为国内最接近英伟达+特斯拉模式的企业[2] - 机器人领域需要硬件与模型的深度整合 二次开发难以实现最佳性能[7][8]
Tesla CEO Elon Musk Just Delivered Incredible News for Nvidia Stock Investors
The Motley Fool· 2025-08-14 18:15
特斯拉AI战略转型 - 特斯拉从传统汽车制造商和绿色能源先驱转型为全栈技术企业 重点发展人工智能在下一代产品和服务中的应用 包括人形机器人和全自动驾驶车队 [1][2] - 公司宣布放弃独立超级计算机平台Dojo 将其称为"进化死胡同" 转而聚焦于芯片项目AI5和AI6的开发 [5] - AI6设计更具多功能性 可同时处理训练工作负载和神经网络推理 适用于特斯拉更广泛的基础设施用例 无需Dojo这种专业化计算平台 [5] 特斯拉技术路线调整 - Dojo原本是特斯拉在AI基础设施领域的重大尝试 旨在通过垂直整合AI架构建立计算堆栈所有权和竞争护城河 [3][4] - 战略调整源于追求多个针对不同应用的芯片设计缺乏战略和经济意义 AI6代表更综合的解决方案 [5] - 公司将在过渡期依赖外部GPU供应商 包括目前已有部分合作的英伟达 同时需要时间构建、开发和扩展新服务 [6] 英伟达受益分析 - 特斯拉决策强化了行业现有领导者的地位 表明即使最具技术野心和财务实力的企业也难以超越成熟行业巨头 [7] - 该转型为英伟达汽车业务创造重大机遇 其计算和网络服务仍是主要利润驱动 但汽车业务正成为新兴增长引擎 [8] - 更多汽车制造商可能效仿特斯拉 认识到定制基础设施成本高昂且耗时 从而加强对外部硬件软件系统的依赖 [9] 行业影响展望 - 英伟达在自动驾驶汽车和机器人领域的影响力未来几年可能显著扩大 巩固其作为AI基础设施生态系统核心供应商的地位 [10] - 行业对英伟达汽车产品生态系统的需求可能加速增长 为公司核心数据中心业务之外的基础设施增长提供新动力 [9]
叫停Dojo AI项目后,特斯拉对工程师团队进行重大重组
新浪财经· 2025-08-13 09:35
据报道,特斯拉公司近日对工程师团队进行重大重组,此前首席执行官埃隆·马斯克叫停了公司的自研 芯片和超级计算机项目。据知情人士透露,这个名为"Dojo"的项目现已拆分,相关人员被调配至多个部 门。其中部分专注于软件开发的员工已转由Ashok Elluswamy领导,其目前在特斯拉负责机器人出租车 和人形机器人领域的人工智能研发工作。另有知情人士表示,从事硅基芯片或半导体研发的其他工程师 团队已转由Aaron Rodgers领导,其负责特斯拉自动驾驶硬件研发,并主导AI5芯片项目。固件开发团队 则交由Silvio Brugada管理。目前,特斯拉公司及马斯克本人均未就此事置评。 ...
特斯拉(TSLA):深度研究系列(1):山雨欲来风满楼:站在Robotaxi商业模式跑通前夜理解特斯拉车企转型AI公司的变革
中泰证券· 2025-08-12 17:41
投资评级 - 首次覆盖给予"增持"评级 [5] - 预计2025-2027年归母净利润分别为55 7/84 9/154 5亿美元 对应PE分别为191 0/125 3/68 8 [8] 核心观点 - 特斯拉正从汽车制造商向AI企业转型 近30%新增CapEX投入AI基础设施建设 [8] - 智能驾驶业务(FSD/Robotaxi)是当前最重要的环节 估值逻辑转变为"技术突破→新商业模式→新现金流→提升PE" [8] - 整车销售和储能业务作为现金牛支撑转型 通过平台共享和产线优化深挖潜力 [8] - 机器人业务着眼远期成长 但当前市值计价不充分 [8] 业务转型分析 智能化转型 - 2Q24起股价与汽车交付量出现背离 显示市场认知从整车制造向AI公司转变 [8] - AI基础设施固定资产达61 7亿美元 占季度CapEX的29% [8][44] - 形成Cortex数据中心和Dojo超算等AI成果 训练算力达等效12万张H100 GPU [45][48] 智能驾驶业务 - FSD累计行驶里程达45亿英里 事故间隔里程669万英里显著优于人类 [62][64] - 软件架构完成v12端到端转型 正向无监督版升级 已在北美全量推送 [78][89][93] - 商业模式包括FSD订阅(北美8000美元买断/99美元月费)、Robotaxi和软件授权 [104][107] 传统业务调整 - 全球汽车产能连续8个季度维持在235万辆 无新增工厂投资 [49][52] - 车型平台收敛 取消Cybercab共平台廉价车转为与Model Y共享平台 [8] - 储能业务毛利率超30% 成为重要利润来源 [8] 财务预测 - 预计2025-2027年营收分别为990 2/1294 9/1614 8亿美元 增速+1 4%/+30 8%/+24 7% [8] - 同期归母净利润增速-21 5%/+52 5%/+82 0% [8] - 当前PE-ttm达167 5 显著高于传统车企15倍上限 [32][34] 行业影响 - 特斯拉突破传统车企估值范式 带动新势力采用PS估值方式 [33][37] - 技术路线引领行业 国产车企跟进端到端架构和硬件降本趋势 [75][96] - 开创"软件定义汽车"新模式 智驾系统渗透率持续提升 [100][104]
特拉斯叫停自研芯片,原因揭秘
财联社· 2025-08-11 14:35
特斯拉芯片战略调整 - 公司叫停Dojo芯片设计项目,原项目负责人Peter Bannon离职,因资源分散于两种AI芯片设计不合理[1] - 未来AI5、AI6及后续芯片将专注支持人工智能和自动驾驶训练,AI6由三星电子代工,订单规模达165亿美元[1] - AI5芯片由台积电代工,初期在中国台湾生产,后续转移至美国亚利桑那州[2] 技术架构整合 - 直接采用AI5和AI6芯片训练自动驾驶系统,通过集成多芯片主板降低网络布线复杂度及成本[3] - 放弃双轨策略(车用推理与云端训练分立),因实际运作导致资源分散和成本上升[3] - AI5性能跨代提升显著,可满足FSD架构训练需求,内部评估整合数千片AI5晶片用于下一代AI模型训练(暂称Dojo 3)[3] Dojo与AI6的技术延续性 - Dojo原采用晶圆系统设计(5×5网格)和蚀刻互连技术,高速数据传输特性将延续至AI6架构[3][5] - Rivian高管Phil Beisel指出,AI6实质是Dojo的广义延续,未来所有研发资源聚焦AI6[5][6] - 马斯克确认公司资源将集中投入单一芯片架构(AI6),不再并行开发差异较大的设计[6][7] 行业技术趋势 - 加速计算(Accelerated Computing)自2023年末成为主流技术趋势,引发全球关注[11]
特斯拉芯片新计划披露
半导体行业观察· 2025-08-10 09:52
特斯拉AI芯片战略调整 - 特斯拉已停止Dojo项目,因资源分散用于两种不同AI芯片设计不合理 [1] - 公司将集中资源开发AI5/AI6芯片,用于训练FSD和Autopilot系统 [1][5] - AI5/AI6芯片将推广至消费产品线,包括Optimus、Cybercab和下一代Roadster [1] AI6芯片的技术定位 - AI6被视为Dojo的延续架构,性能已足够替代Dojo的超级计算机功能 [2][6] - D1与AI5/AI6共享核心设计元素,如矩阵乘法和高度并行处理 [6] - AI6采用晶圆系统设计,未来所有研发资源将集中于此 [6] 三星与特斯拉的芯片代工合作 - 三星获得特斯拉165亿美元AI6芯片代工合同,占其2024年预计销售额的7.6% [9][10] - 合同有效期至2033年底,实际金额可能远超165亿美元 [9] - 三星德州泰勒工厂将专门生产AI6芯片,马斯克将亲自监督生产进度 [7][9] 三星代工业务影响 - 交易推动三星股价上涨6.83%,收盘价70,400韩元,为10个月新高 [10] - 三星代工业务此前年亏损数万亿韩元,该订单有望改善业绩 [10][12] - 芯片采用2纳米工艺,三星需解决良率问题以确保盈利 [12] 行业竞争格局 - 三星当前全球晶圆代工市场份额仅7.7%,远低于台积电的67.6% [12] - 特斯拉订单被视为对三星技术的信任背书,可能吸引更多客户 [12] - 台积电将负责生产特斯拉AI5芯片,采用3纳米工艺 [9][12]
又一颗芯片,被英伟达打败
36氪· 2025-08-09 14:32
特斯拉Dojo项目终止 - 特斯拉解散Dojo团队并终止自研训练芯片项目 核心负责人包括Jim Keller、Ganesh Venkataramanan和Peter Bannon相继离职 [1][3] - Dojo项目曾计划实现超1 ExaFLOP级ML计算能力 采用自研D1芯片+Training Tile架构 单芯BF16/CFP8算力达362 TFLOPS 单块Tile算力达9 PFLOPS [2][6] - 项目终止主因转向采购成熟GPU平台 2024年Q4上线5万张H100集群 2025年Q2新增1.6万H200 总规模等效6.7万张H100 [4] 行业自研训练芯片困境 - 生态与软件壁垒是最大挑战 CUDA/cuDNN等工具链需长期打磨 多数厂商难以稳定释放算力密度 [7] - 系统工程与供应链制约明显 先进封装和HBM供给被英伟达主导 台积电CoWoS-L七成产能已被锁定 [8] - 需求与现金流要求苛刻 仅云巨头能实现"芯片-集群-云服务"正循环 Meta训练芯片项目进展缓慢 [9] - 机会成本过高 芯片代际升级以季度为单位 自研方案易落地即落后 AMD MI325X性能已超H200达8% [10] 英伟达系统性优势 - 构建全栈交付能力 涵盖GPU+NVLink+高带宽内存+机架级整机+网络方案+软件工具 [12] - 实现"AI工厂"式交付 GB200 NVL72液冷整柜支持576 GPU无阻塞拼合 提供交钥匙工程 [12] - 部署效率惊人 xAI Colossus超级计算机连接10万Hopper GPU 从装机到训练仅用19天 [12] 行业策略转向 - 特斯拉调整战略 训练端外采英伟达/AMD 推理端与三星签订165亿美元代工协议自研AI6芯片 [5] - 非云巨头普遍采用"训练公版平台+推理自研SoC"策略 聚焦端侧差异化 [13] - 行业共识形成 自研训练芯片仅适合云巨头 车企/应用公司机会成本过高 [11][14]