Workflow
DeepSeek R2 因芯片问题推迟发布
是说芯语·2025-08-14 14:28

公司动态 - DeepSeek因使用华为昇腾芯片训练R2模型时遇到技术问题(稳定性欠佳、软硬件支持不足、芯片通信慢),被迫在训练阶段改用英伟达芯片,推理阶段仍用华为芯片,导致R2模型发布从5月起推迟[2][4] - 华为已派遣工程师团队协助DeepSeek解决昇腾芯片适配问题,但公司仍无法在昇腾上完成训练运行,目前仅推进推理兼容[7][8] - 创始人梁文锋对研发进度不满,加码投入以维持AI领域领先地位,同时数据标注耗时超预期进一步延迟发布,模型或几周内推出[2][8] 行业背景 - 中国政策鼓励科技公司采用华为、寒武纪等国产芯片替代英伟达,近期要求企业说明订购英伟达H20芯片的理由[7] - 国产芯片存在稳定性差、芯片间连接速度慢、软件性能不足等问题,导致关键任务仍依赖英伟达[4][6][7] - 中美地缘政治影响下,英伟达同意上交部分在华收入以恢复H20芯片销售,并强调开发者对AI生态的关键作用[11] 技术挑战 - 训练阶段对芯片性能要求极高,昇腾芯片目前难以胜任,而推理阶段兼容性相对容易实现[4][6] - 加州大学研究员指出,华为昇腾芯片面临"成长的烦恼",但未来可能突破训练瓶颈[10][11] 竞争格局 - 行业研究员认为AI模型易被替代,开发者转向阿里通义千问3等竞品,后者借鉴DeepSeek算法但使用效率更高[9] - DeepSeek R2延迟发布使其落后于竞争对手,凸显国产芯片技术自主的阶段性困境[4][6]