如果DeepSeek选择华为,黄仁勋说的“灾难”到底是什么?
英伟达英伟达(US:NVDA) 虎嗅APP·2026-04-19 17:22

核心观点 - 英伟达创始人黄仁勋对DeepSeek下一代模型V4可能率先在华为昇腾平台发布表示担忧,认为这对美国是“灾难性”的,其核心焦虑并非中国做出好模型,而是顶级开源模型可能不再以英伟达CUDA生态作为默认和首要的优化起点,这将动摇其“事实标准”的生态护城河[5][6][7] - 华为通过“以规模换效率,以系统换单点”的系统工程路径构建算力竞争力,其大规模集群在算力上已可比肩甚至超越英伟达旗舰方案,尽管功耗较高,但中国在可再生能源方面的优势可部分抵消此成本[9][10] - 黄仁勋的言论是一次精心策划的战略喊话,旨在同时向美国政策圈和中国市场传递信息:对美方强调需通过保持芯片销售来维持CUDA生态优势,对中方暗示脱离英伟达路径将面临更高成本,其根本目标是保住中国市场收入并维持CUDA的生态主导地位,防止出现一个由顶级模型背书的、成功的非CUDA全栈替代路径[12][13][16][17] 英伟达的竞争焦虑与生态护城河 - 英伟达真正的护城河并非GPU算力,而是CUDA作为“事实标准”的软件生态位,过去近二十年,主流AI框架和模型的首发优化均以CUDA为默认起点[6] - 生态护城河的自我强化逻辑在于:模型先在CUDA上优化,迁移到其他硬件需付出以月计的工程代价,使得其他硬件成为“备选方案”,从而巩固CUDA的默认地位[6] - 英伟达担忧DeepSeek V4在华为昇腾首发,将首次公开打破“开源模型必须以CUDA为首要优化目标”的默认规则,证明存在一条被顶级模型验证过的非CUDA可行路径,并积累起相应的工程师、经验和用户信心[7] - 公司的竞争策略是“向外吸纳、向内收敛”,即允许其他能运行CUDA的加速器纳入生态,但必须确保CUDA是不可替代的中心,以此保持“平台”身份,但华为的全栈布局使其成为无法被吸纳的平行宇宙对手[13][14] 华为的算力发展路径与竞争力 - 华为昇腾910C单卡FP16算力约800TFLOPS,与英伟达Blackwell旗舰仍有约三倍性能差距,但华为采用系统工程和群体战术进行竞争[9] - 2025年4月推出的CloudMatrix384超节点,集成384颗910C芯片,BF16集群算力达300PFLOPS,是英伟达GB200NVL72旗舰集群算力的1.7倍,HBM总容量达后者3.6倍,但整体功耗近560千瓦,约为英伟达同级方案的四倍[9] - 华为公布了激进的路线图,包括Atlas950(8192卡)和Atlas960(15488卡)超节点,走“以规模换效率,以系统换单点”的清晰发展路径[10] - 中国拥有全球第二大计算市场、约一半的AI研究人员、庞大的算力总量以及可再生能源优势,为华为的路径提供了基础[10] DeepSeek模型迁移的象征意义与影响 - DeepSeek V3/R1已证明中国能以极低成本训练出接近OpenAI水平的模型,动摇了“算力决定一切”的范式[11] - 若V4真以昇腾首发,其象征意义远超V3,将从证明“中国能做好模型”升级为证明“中国能在自己的硬件上做好模型”,这标志着从“客户”到“对手”的转变[11] - 此举意味着顶级模型、顶级硬件与开源传播首次在中国大陆完整结合,将在全球开源社群形成首发效应,为英伟达主导的“模型-框架-硬件”默认栈提供一个被主流证实可用的备份栈,在叙事上动摇“CUDA是唯一起点”的观念[20] 黄仁勋言论背后的商业策略与市场现实 - 黄仁勋在访谈中存在逻辑矛盾:一方面以DeepSeek的成功论证出口管制无效,另一方面又以“防止中国脱离生态”为由主张继续对华销售芯片,这揭示了其真实目标是同时保住中国市场收入和CUDA生态位[12][13] - 其言论是对美国出口管制导致业务受损的直接反应,从A100/H100被禁到专供中国版H20的销售波折,中国市场需求依然强劲,例如字节、阿里、腾讯在被禁前三个月曾下单超过160亿美元的H20订单[15] - 黄仁勋承认中国在算法和AI研究人员数量上的根本优势,意在向美国政策圈传递“制裁无法阻止中国赶超”的信号,为解除限制铺路,但此逻辑也可能强化中国“全面去CUDA化”的决心[15] - 此次访谈选择在DeepSeek V4传闻与正式发布之间的关键时间点,通过技术播客精准投向技术社群与政策圈,其核心论证是“无法通过阻断来赢,只能通过保持在场来赢”,本质是为继续销售芯片进行包装[16]

如果DeepSeek选择华为,黄仁勋说的“灾难”到底是什么? - Reportify