G200

搜索文档
DeepSeek V3到V3.1,走向国产算力自由
虎嗅APP· 2025-08-24 17:02
DeepSeek-V3.1技术升级 - 公司发布V3.1版本采用混合推理架构,同时支持思考模式和非思考模式,提高思考效率并减少token消耗和时间成本[6] - 模型通过后训练优化提升Agent能力,外扩训练增加840B token,上下文长度和两种模式均达到128k[8] - API Beta接口支持strict模式Function Calling,提升工程可靠性和企业易用性,并增加对Anthropic API格式支持以渗透其企业市场[8][9] UE8M0 FP8超低精度创新 - 公司采用UE8M0 FP8 Scale参数精度,这是一种对数数值系统(LNS)特化实现,用于存储缩放因子而非直接权重[11][13][24] - 该格式兼容MXFP8标准,可在支持该标准的硬件(包括英伟达Blackwell和国产GPU)上直接运行,减少75%内存使用并提升训练推理效率[4][13][27] - 超低精度设计覆盖极宽动态范围,通过软件定义适配国产芯片,使国产GPU能高效运行大模型[13][24][27] 算力自主战略路径 - 公司分两阶段突破:先通过魔改PTX指令集最大化利用英伟达GPU算力利用率,再通过UE8M0 FP8降低算力物理需求适配国产芯片[4][26][27] - 软硬件协同优化构建"算力无关"模型生态,长期减少对进口先进GPU依赖并推动国产芯片生态发展[4][27][32] - 超低精度技术加快国产下一代GPU推出(如寒武纪、沐曦、燧原、昇腾),形成去英伟达化路线[14][27][32] 对英伟达市场的影响 - UE8M0 FP8技术降低对H20/B30等缩水版芯片需求,国产芯片生态完善将削弱CUDA锁定效应[29][30][32] - 英伟达优势仍存于G200的更大带宽、更强互联和显存以及CUDA生态绑定,但低成本训练路径弱化其必选性[32] - 公司技术路线可能影响英伟达中国市场策略,中长期国产方案更受成本敏感企业青睐[29][30][32]
中美芯片战,正在变成黄仁勋的机会
虎嗅· 2025-07-17 16:29
英伟达在中美芯片战中的战略定位 - 黄仁勋通过"主权AI"概念推动全球各国发展本土AI基础设施,促进英伟达GPU销售 [3] - 公司在中美科技脱钩背景下持续为中国市场定制缩水版芯片(A800/H800/H20)以维持市场份额 [3][10] - 英伟达市值突破4万亿美元,成为AI技术革命的核心受益者 [2] 中国市场策略与表现 - 2024年初H20芯片在中国市场销售额达160亿美元 [11] - 黄仁勋年内三次访华,强调中国供应链先进性和科技创新活力 [1][2] - 公司重要客户包括DeepSeek、阿里巴巴等中国AI领军企业 [1] 地缘政治博弈 - 英伟达成功游说特朗普政府废除拜登时期的AI芯片出口限制政策 [4][5] - 公司通过"技术代差"策略向中国出售性能缩减70%的H20芯片(相比H100) [10] - 黄仁勋同时强化与中东(阿联酋/沙特)的芯片合作 [5] 产品与技术路线 - 计划2024年9月推出为中国定制的Blackwell架构缩水版B30芯片 [11] - 正在出货新一代G200芯片,保持对中国的技术领先 [10] - 通过差异化产品策略延长每代架构的盈利周期 [11] 行业竞争格局 - 中国AI崛起打破硅谷垄断,客观上扩大英伟达GPU需求 [2] - 华为昇腾芯片被黄仁勋公开认可为H20级别竞争对手 [7][8] - 中国具备构建独立AI生态的潜力(算力节点/通信网络/电力供应) [7]