Workflow
H100
icon
搜索文档
我们还是低估了英伟达
美股研究社· 2025-09-18 19:33
文章核心观点 - 英伟达战略重心从自建云服务DGX Cloud转向平台化算力调度市场Lepton 以化解与云巨头的渠道冲突并掌控AI算力生态入口 [6][11][23] - 公司通过"卖芯片-投资客户-租回服务"模式构建自循环资金链 强化生态黏性并稳定市场价格预期 [13][17][18] - Lepton平台通过聚合跨云算力资源并统一软件栈 试图成为AI算力领域的"App Store" 掌握分配权与数据洞察能力 [21][26][27] 战略转型 - 2023年推出的DGX Cloud月租达36999美元 2024年底其所属的软件与服务收入达20亿美元年化规模 [6][8] - 2024年下半年云厂商大幅降价 AWS对H100和A100实例降价45% 导致DGX Cloud价格优势消失 [8] - 2025年公司不再将数十亿美元云支出承诺对齐DGX Cloud 其角色转为内部基础设施与研发用途 [6][11] - 2025年5月新上线Lepton平台 转型为算力调度市场 避免与AWS/Azure/GCP等云厂商直接竞争 [6][11][23] 生态构建模式 - 投资云服务商并优先供货:2023年向CoreWeave投资1亿美元并优先供应H100 GPU [13] - 租回算力协议:2025年9月与Lambda签订4年15亿美元租赁协议 租用1万台搭载自家GPU的服务器 [15] - 形成资金闭环:芯片销售即时确认收入 租赁支出分期摊销 最小化资产压力 [17] - 通过Nventures投资AI初创公司 绑定潜在算力需求客户 构建创业孵化器生态 [19] Lepton平台特性 - 不直接持有GPU库存 作为需求分发平台连接开发者与云服务商(包括AWS/Azure/CoreWeave等) [11][21] - 整合英伟达软件栈(NIM微服务/NeMo框架) 提供一致开发体验 [22] - 获得AWS和Azure等云巨头支持 通过平台接触额外算力需求 [23] - 实时观测算力任务类型、地域分布、GPU使用频率及价格弹性 辅助商业决策 [26] 市场影响 - 缓解渠道冲突:从直接竞争转为中立调度方 维持与云巨头的芯片销售合作关系 [11][23] - 锚定算力价格:英伟达回租行为变相为AI算力行情背书 稳定市场预期 [18] - 掌控价值链:无论客户选择哪家云服务商 最终依赖英伟达GPU和软件栈 [29] - 潜在挑战:中小云厂商担心客户关系与定价权被影响 推广仍需过程 [26]
我们还是低估了英伟达
投中网· 2025-09-18 14:33
以下文章来源于极客公园 ,作者芯芯 极客公园 . 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 将投中网设为"星标⭐",第一时间收获最新推送 英伟达的云霸主梦未灭。 作者丨 芯芯 编辑丨 靖宇 来源丨 极客公园 即便市值已经突破 4 万亿美元,我们还是低估了英伟达,大大的低估了。 DGX Cloud 为什么退场?Lepton,能不能接承接住英伟达在 AI 时代成为云计算霸主的野心? 以退为进 很多人或许都还记得 2023 年的「GPU 荒」,企业即便有钱,也往往买不到 H100。于是英伟达顺 势推出了 DGX Cloud,把自有的高端算力集群「按月出租」,企业开通即用。 在推出的第一年,DGX Cloud 的确收获了热度。到 2024 年底,英伟达的财报显示其软件与服务收 入(包括 DGX Cloud)达到了 20 亿美元的年化水平。 然而,转折点出现在 2024 年下半年后,随着 GPU 供应逐渐缓解,亚马逊、微软、谷歌等云厂商 纷纷「砍价」,DGX Cloud 的优势随之消散。以亚马逊的 AWS 为例,其对 H100 和 A100 实例 降价幅度高达 45%,远低于 DGX Cloud ...
China finds Nvidia violated antitrust law in chip deal probe
BusinessLine· 2025-09-15 19:13
China ruled that Nvidia Corp. violated anti-monopoly laws with a high-profile 2020 deal, ratcheting up the pressure on Washington during sensitive trade negotiations.The US chipmaker was found in violation of antitrust regulations after the acquisition of networking gear maker Mellanox Technologies Ltd., the State Administration for Market Regulation said after concluding a preliminary investigation. Nvidia’s shares fell about 2% in pre-market trading, while US stock index futures pared gains.The surprise a ...
How AMD, Nvidia, Broadcom Can Ride Oracle's $455B Cloud Surge
Forbes· 2025-09-12 17:35
CHINA - 2025/09/04: In this photo illustration, the logo of Advanced Micro Devices, Inc. (AMD) is displayed on the screen of a tablet. (Photo Illustration by Sheldon Cooper/SOPA Images/LightRocket via Getty Images)SOPA Images/LightRocket via Getty ImagesOn Monday, during its earnings announcement, Oracle (NYSE:ORCL) delivered a striking revelation that surprised even the most optimistic analysts. The company’s remaining performance obligations (RPO) for its cloud division surged 359% year-over-year, re ...
魏少军:摒弃英伟达 GPU !
是说芯语· 2025-09-12 16:31
核心观点 - 亚洲AI发展过度依赖美国硬件技术 特别是英伟达GPU 这种依赖将削弱地区自主性并构成长期风险 必须突破美国技术范式 在算法和计算基础设施等基础领域另辟蹊径[1][3][8] 模仿陷阱 - 亚洲AI研发机构在训练大语言模型和多模态模型时几乎清一色采用英伟达GPU作为核心算力支撑 A100和H100系列产品凭借强大张量核心和高效CUDA生态成为亚洲AI实验室标配[3] - 当前亚洲AI发展模式过度效仿美国路径 即采用英伟达或AMD计算GPU训练大型语言模型 这种模仿会削弱地区自主性 若不改变可能产生致命影响[1] 上游空心化 - 英伟达GPU核心技术包括架构设计 制程工艺 软件生态均掌握在美国企业手中 H100采用台积电4nm工艺制造 但芯片设计核心IP和指令集架构由英伟达主导[4] - 配套CUDA工具链形成难以替代的技术壁垒 亚洲企业在AI算法研发和应用场景落地方面具备优势 但在算力基础设施核心环节始终处于被动跟随状态[4] 算力成本陷阱 - 大语言模型参数规模从百亿级向万亿级突破 对算力需求呈指数级增长 训练千亿参数LLM需要投入数千块英伟达A100 GPU[5] - 单台服务器成本超过百万元 整个训练周期硬件 电力 运维成本高达数亿元 英伟达凭借市场垄断地位不断提高产品定价 H100售价相比A100上涨超过50%[5] 供应链风险 - 亚洲在AI算力领域对英伟达依赖本质是将半导体产业链核心环节交由外部控制 2022年美国出台半导体出口管制措施 明确限制英伟达A100 H100等高端GPU对华出口[6] - 英伟达后续推出阉割版H20 L20 GPU 但性能大幅下降 无法满足高端AI训练需求[6] 数据安全风险 - AI训练与推理过程涉及大量敏感数据包括企业商业数据 个人信息数据和国家关键领域数据 英伟达GPU硬件架构和软件系统均由美国企业设计[7] - 硬件内部是否存在数据采集传输后门存在不确定性 依赖外部硬件进行敏感数据AI处理增加了数据泄露风险[7] 技术创新停滞风险 - 模仿美国模式限制区域自主权核心在于生态锁定对创新的抑制 英伟达凭借CUDA生态构建从硬件到软件完整生态体系[8] - 全球超过90% AI开发者使用CUDA工具链 大量AI框架如TensorFlow PyTorch优先适配英伟达GPU 生态锁定抑制了区域技术创新[8]
一文拆解英伟达Rubin CPX:首颗专用AI推理芯片到底强在哪?
Founder Park· 2025-09-12 13:07
产品发布与性能 - 英伟达发布新一代Rubin CPX GPU 专为海量上下文AI处理设计 支持百万级token推理 于2025年9月9日推出[5] - 单卡算力达30 PFLOPS(NVFP4精度) 配备128GB GDDR7显存 硬件编解码引擎使长序列注意力加速提升3倍 单卡可在1秒内完成百万token级推理[2][5] - 采用分工策略:Rubin CPX(GDDR)负责预填充(prefill)阶段 Rubin HBM GPU负责解码(decode)阶段 优化算力与内存带宽利用率[9][10][12] 架构创新与成本优势 - 核心创新为用GDDR7替代HBM 内存成本降低5倍/GB 同时省去NVLink接口 每GPU节省约8000美元[12] - 芯片成本仅为R200的1/4 但提供80%算力 整机TCO在预填充场景下从每小时0.6美元降至0.06美元 降幅达90%[12][13] - 通过专用芯片分工(prefill与decode分离)实现算力极致优化 后续可能推出解码专用芯片进一步降低成本[16] 系统性能与对比优势 - 搭载Rubin CPX的Vera Rubin机架处理大上下文窗口性能比GB300 NVL72高6.5倍 提供8EFLOPS(NVFP4精度)算力 100TB内存及1.7PB/s带宽[14][20] - 机柜集成144个Rubin CPX GPU、144个Rubin GPU及36个Vera CPU 采用Oberon方案 每个compute tray含8个CPX芯片及8个CX-9网卡[20] - 对比竞争对手:AMD MI300机架带宽20.5TB/s但需追赶到2027年 谷歌TPU缺预填充专用芯片 AWS Trainium受限于EFA网卡需外挂机架 其他厂商自研芯片需18个月流片[20] 产业链影响:PCB与光模块 - PCB需求新增:CPX芯片需专用PCB(预计HDI方案) Rubin模组与CPX间采用44层正交中板替代线缆 材料可能升级为M9+二代布+四代铜[24][27][28] - 英伟达单GPU PCB价值量从GB200的400美元提升至VR200的900美元 预计2025-2027年PCB总市场规模达131/289/707亿元人民币[29] - 光模块配置提升:每个compute tray配8个CX-9网卡(推测1.6T端口) Rubin NVL144光模块配比较GB300翻倍 因单die带宽提升至800G[30][32][37] - 2026年全球1.6T光模块需求上调至1500万只 2027年预计达4000-5000万只 推理步骤解耦推动单托盘GPU数量增加 进一步带动光模块需求[35][36][37] 电源与散热升级 - 整机功耗从180-200kW提升至350kW 推动供电架构向直流化/高压化演进:800V HVDC替代传统UPS 二次侧电源升级至800V-50V[39][40] - 液冷与电源需求增长 国内供应商如中恒电气(HVDC龙头)、科士达(北美代工)、盛弘股份(模块开发)等积极布局海外市场[41][42][43] 技术规格与路线图 - Rubin CPX采用N3P制程 单芯片功耗800W(带内存880W) 无NVLink 仅支持PCIe Gen6接口[12][17] - 对比路线图:Rubin CPX算力20PFLOPS(稠密) 内存带宽2TB/s 而R200带宽20.5TB/s Rubin Ultra内存带宽达53TB/s(2027年)[7][12][17]
“英伟达税”太贵?马斯克领衔,AI巨头们的“硅基叛逆”开始了
创业邦· 2025-09-11 11:09
文章核心观点 - AI巨头自研芯片的深层战略考量正改变产业估值逻辑和权力格局 远超解决芯片短缺和降低成本的表面动机 [9][10] - 推理成本将超越训练成本成为AI商业化最大瓶颈 自研芯片首先瞄准推理环节 [25] - 2026年晶圆产能争夺战将决定AI算力竞争胜负 考验供应链管理和资本实力 [27] 巨头自研芯片战略动机 - 摆脱性能枷锁:通过软硬协同实现极致性能功耗比 在数据中心节省数亿至数十亿美元电费和运营成本 [11][13] - 重构经济模型:将不可控运营成本转化为可控资本开支 改变长期成本结构并构建财务护城河 [14][16] - 构筑数据壁垒:芯片架构成为AI战略的物理化身 形成"数据-模型-芯片"正向飞轮固化竞争优势 [17] 半导体产业链格局变化 - 台积电成为AI时代产能分配核心:3nm工艺产能被苹果及Google Meta 亚马逊 微软等AI巨头瓜分 [19][21] - 英伟达面临围城之势:CUDA生态优势在封闭场景下被削弱 但迁移成本仍构成护城河 [22][24] - 博通成为隐形赢家:为巨头提供定制化ASIC芯片设计服务 深度绑定多家AI领军企业 [26] AI商业化趋势与产能竞争 - 推理成本占比将达80%-90%:AI应用生命周期总成本中推理成为持续性海量消耗 [25] - 2026年产能决战:台积电3nm/2nm产线将汇集苹果 英特尔 英伟达及AI巨头自研芯片 [27] - 供应链能力成为关键:产能绑定协议和预付款规模将决定算力落地能力 [27]
瑞萨投资了一家芯片公司:英伟达挑战者
半导体行业观察· 2025-09-05 09:07
公司战略与市场定位 - 公司计划在2026年业务扩大 重点关注机器人和航空航天应用[4] - 公司预计2028年做好IPO准备 并考虑在美国上市[2][5] - 公司已通过股权和政府融资筹集近1亿美元 投资者包括日本瑞萨电子和SBI Holdings[5] 技术优势与产品特性 - 公司芯片Sakura-II在计算能力相当情况下 能效比英伟达H100芯片高出四倍[5] - 芯片设计通过减少内存访问降低能耗 解决"内存墙"技术问题[6] - 芯片可直接在边缘设备(如卫星/智能手机)处理AI工作负载 无需依赖数据中心[2] 商业合作与应用场景 - 公司与美国国防部下属国防创新部门签订原型合同 系日本半导体公司首次加入该项目[3] - 与日本月球任务初创公司ispace合作探索低功耗AI引导的月球着陆和导航[3] - 正与"美国大型航空航天公司"测试芯片在商用飞机运行AI的功能[3] 行业竞争格局 - 边缘AI芯片市场被认定为完全开放的竞争环境 英伟达未占据主导地位[2] - 公司定位为无晶圆厂芯片设计企业 商业模式类似英伟达但规模较小[5] - 芯片专注于特定AI部署流程 与英伟达通用型芯片形成差异化竞争[5]
【每日收评】集微指数跌0.83%,英伟达表示H100/H200供应满足一切订单
巨潮资讯· 2025-09-03 18:03
A股市场表现 - 沪指跌1.16%收报3813.56点 深证成指跌0.65%收报12472.00点 创业板指涨0.95%收报2899.37点 [1] - 沪深两市成交额23641亿元 较昨日缩量5109亿元 [1] - 半导体板块表现疲弱 117家半导体公司中仅20家市值上涨 95家下跌 [1] 全球主要股指动态 - 标普500指数跌0.69%报6415.54点 道指跌0.55%报45295.81点 纳指跌0.82%报21279.63点 [2] - 明星科技股普跌 英伟达跌1.95% 亚马逊跌1.60% 特斯拉跌1.35% 苹果跌1.04% [2] - 热门中概股多数上涨 房多多涨9.4% 小米和理想汽车涨约5% 蔚来/阿里/新东方/京东/拼多多涨超3% [2] 半导体企业动态 - 集微半导体产业指数收报5583.91点 单日下跌0.83% [7] - 指数成份股选取自118家样本库中的30家企业 覆盖电子元件/材料/设备/设计/制造/IDM/封测/分销等领域 [6] - 江化微/至纯科技/通富微电位列半导体公司市值涨幅前列 北斗星通/有研新材/旋极信息领跌 [1] 重点公司业务进展 - 帝奥微推出自主研发eUSB2中继器产品 实现核心技术突破并填补国内空白 [3] - 航宇微选举杨涛为新任董事长 颜志宇不再代行董事长职责 [3] - 派瑞股份与西安电力电子技术研究所签订战略协议 联合开展中高压IGBT功率器件研发 [3] 企业运营与资本动态 - 宇树机器人计划2025年10-12月提交IPO申报文件 由中信证券担任辅导机构 [1] - 蔚来第二季度营收190亿元 Non-GAAP净亏损41.3亿元 毛利率稳健且费用控制有效 [4] - 英伟达澄清H100/H200供应充足 否认产品售罄传闻 强调可无延误满足新订单 [4] 消费电子领域动态 - 小米集团新机小米16已获入网许可 总裁卢伟冰通过微博暗示新品即将发布 [4]
美国迎来一座大型封装厂
半导体行业观察· 2025-09-03 09:17
项目投资与建设 - 安靠科技将在亚利桑那州皮奥里亚建设价值20亿美元的先进封装和测试设施 占地104英亩 预计2028年初投产 [2] - 修改后的建设计划已于8月29日获得皮奥里亚市议会批准 将原定地块更换为创新核心区面积更大的地块 [2] 行业背景与战略意义 - 该设施是美国迄今为止最雄心勃勃的外包半导体封装业务 标志着供应链后端开始匹配美国晶圆厂建设浪潮 [2] - 当前高端芯片的最终组装、测试和封装阶段主要由台湾和韩国工厂主导 形成供应链瓶颈 [2] - 英伟达H100等AI芯片产能曾因封装吞吐量限制遭遇瓶颈 [2] - 后摩尔定律时代性能提升重点从晶体管数量转向连接性能 先进封装技术成为关键 [2] 技术合作与客户关系 - 新工厂将专门支持高性能封装平台 包括台积电的CoWoS和InFO技术 [3] - 台积电已签署谅解备忘录 计划将其附近菲尼克斯晶圆厂的封装业务转移至该工厂 缩短目前数周的亚洲周转时间 [3] - 苹果公司据称为首家也是最大客户 [3] 政策支持与行业挑战 - 项目获得《芯片法案》4.07亿美元资金支持和联邦税收抵免 [3] - 美国所有计划建设的晶圆厂预计面临7万至9万名工人短缺 高度自动化也无法完全解决人才短缺问题 [3]