引入LPU的英伟达,是在补强,还是在拆自己的护城河?丨GTC观察
英伟达英伟达(US:NVDA) 雷峰网·2026-03-31 21:54

文章核心观点 文章围绕英伟达GTC大会,探讨了在AI推理时代,因算力需求激增和摩尔定律放缓,行业正从关注经济成本转向关注物理能耗极限,这促使SRAM等旧技术因能效优势回归,并推动了LPU等专用推理芯片、整机柜算力方案以及软硬件生态战略的新趋势,同时分析了中国芯片产业在其中的机遇与挑战 [4][5][6][22] 谈芯片:LPU与SRAM的回归 - 推理时代到来,降低推理成本与延迟至关重要,结构更简化的LPU因此显现优势 [5] - LPU的一大亮点是采用SRAM架构,大幅减少了数据搬运时间,尽管其成本曾是DRAM的6倍,但能效是DRAM的128倍 [5] - 行业衡量标准正从“一美元能买多少Token”的经济逻辑,转向“每焦耳能产生多少Token”的物理能耗逻辑,这使SRAM的能效优势得以重现 [5][22] - 纯SRAM架构并非Groq独有,阿里、Graphcore等公司都曾涉猎;“GPU+LPU”的异构架构也是行业演进方向 [8] - LPU的价值在于其扩大了可触达市场,黄仁勋提出Token分层定价,意味着有人愿为极致性能支付溢价,这使得按LPU价值计算的市场规模扩大了数十倍 [9][27] 谈架构:整机柜算力与毛利率 - 英伟达从Blackwell NVL72到Rubin持续加码“整机柜算力”,旨在应对模型参数膨胀和MoE架构下需要上百张卡协同工作带来的高效互联需求 [13] - 超节点的技术迭代极快,例如英伟达展示了将组装时间从两小时缩短至几分钟的无缆化设计,而AMD的跟进方案仍采用英伟达两年前的互联技术 [14] - 英伟达约70%的高毛利率源于其将技术转化为长期盈利的能力,以及与台积电、Synopsys合作,用自身算力改进芯片设计,形成“智能”反哺“智能”的飞轮效应 [14] - 英伟达的强掌控力基于对核心技术与高价值环节的卡位,其战略是像华为、苹果那样作为链主企业,只吃高增长部分的蛋糕,将毛利较低环节交由供应链 [15] 谈软件:生态建设与国内破局 - 英伟达推出企业版软件栈NemoClaw并配套Nemotron开源模型,在OpenClaw基准测试PinchBench上,任务成功率直逼Claude Opus 4.6和GPT-5.4 [17][18] - 英伟达的软件策略并非与客户抢地盘,而是自己先跑通应用以引导客户,并通过开源开放构筑庞大的安装基础生态,最终为硬件“带货” [19] - 国内芯片公司普遍面临软件团队规模小、客户服务能力弱等困境,难以支撑完整生态建设 [19] - 破局之道包括:国内芯片企业可通过整合形成一两家有实力的平台型公司以集中资源;国内大模型在开源层面已接近国外水平,且国内在超节点的散热、互联、供电等工程化能力上有优势,可以美国几分之一的成本进行量产 [19][20] 行业趋势与国内机遇 - 未来趋势明确:更大的算力系统承载更大的模型,更高的智力产生更高的Token需求 [31] - 算力发展将从民主化转向集中化,真正的算力承担者将集中到云端以降低能耗和成本 [29] - 国内算力资本投入将持续增长,但会产生冗余和淘汰,行业需要出现能带动整个产业链繁荣的强链主企业 [31] - 国内芯片公司不宜盲目追求与英伟达相同的高毛利,而应在芯片互联、模型软硬件调优等领域突破创新,通过性价比打开市场,带动产业链成长 [15] - 对于从业者,行业需要增加对顶级人才的重视;能力稍逊者可选择小的细分赛道进行降维打击,避免与最强对手正面竞争 [31]

引入LPU的英伟达,是在补强,还是在拆自己的护城河?丨GTC观察 - Reportify