AI推理
搜索文档
OpenAI不满英伟达芯片?两高管隔空反驳
36氪· 2026-02-03 15:40
文章核心观点 - 市场传言OpenAI对英伟达最新AI芯片在推理任务上的性能不满并寻求替代方案 凸显了AI推理正成为芯片竞争的新战场 尽管两家公司CEO均公开反驳了关系紧张的传言 [1] AI推理成为竞争新焦点 - AI推理是指AI模型响应用户查询的过程 如今AI进步越来越侧重于将训练好的模型用于推理和判断 这可能是一个全新且更大的发展阶段 [2] - 推理所需的内存比训练更多 芯片需要花费相对更多时间从内存中获取数据 而非执行数学运算 [2] - 英伟达和AMD的GPU技术依赖外部内存 这会增加处理时间并减慢用户与聊天机器人互动的速度 [2] - 竞争对手如Anthropic的Claude和谷歌的Gemini更多依赖谷歌内部制造的TPU芯片 这些芯片专为推理设计 相比英伟达的通用AI芯片更具性能优势 [2] OpenAI对英伟达芯片的具体不满 - 英伟达芯片的短板在OpenAI用于生成代码的“Codex”产品中表现明显 OpenAI员工将Codex的一些不足归咎于基于英伟达GPU的硬件 [3] - OpenAI首席执行官萨姆·阿尔特曼表示 使用其编码模型的客户“会非常看重编码工作的速度” [3] - OpenAI对英伟达硬件在为ChatGPT用户解决特定类型问题(如软件开发和AI与其他软件交互)时提供答案的速度表现不佳感到不满 [4] - OpenAI需要新的硬件来满足其未来约10%的推理计算需求 [4] OpenAI的替代方案与行业动态 - 为满足对速度的需求 OpenAI采取的应对措施之一是推进其最近与Cerebras的合作 [3] - 在投资谈判拖延期间 OpenAI与AMD等其他公司达成协议 以生产与英伟达竞争的GPU [4] - OpenAI曾与包括Cerebras和Groq在内的初创公司讨论合作 以提供用于更快推理的芯片 [5] - 英伟达后来与Groq达成了一项价值200亿美元的授权协议 这导致OpenAI与Groq的谈判破裂 [5] - 芯片行业高管表示 英伟达收购Groq的决定似乎是为了加强其技术组合 以便在快速变化的AI和芯片行业中更具竞争力 [5] 双方公司的公开立场与合作关系 - 英伟达CEO黄仁勋驳斥了与OpenAI关系紧张的报道 称其“纯属无稽之谈” 并表示英伟达计划对OpenAI进行大规模投资 [6] - 英伟达声明称 客户继续选择英伟达进行推理操作 因为其在大规模应用中提供了最佳的性能和总体拥有成本 [6] - OpenAI发言人声明 公司依靠英伟达驱动其绝大多数的推理设备 并且英伟达在每美元的成本效益方面为推理操作提供了最佳表现 [6] - OpenAI CEO萨姆·阿尔特曼表示 公司喜欢与英伟达合作 并且他们生产世界上最好的AI芯片 希望在很长一段时间里成为其超级大客户 [6] 双方的投资谈判与潜在变数 - 英伟达和OpenAI正处于投资谈判阶段 去年9月英伟达曾表示计划向OpenAI投资多达1000亿美元 以换取股份并提供购买先进芯片的资金 [4] - 该交易原预计数周内完成 但谈判拖延了数月之久 [4] - 业内人士透露 OpenAI不断变化的产品路线图改变了其所需的计算资源类型 并使它与英伟达的谈判陷入僵局 [4]
英伟达GPU,被嫌弃了
半导体行业观察· 2026-02-03 09:35
OpenAI与英伟达的关系与合作动态 - 据八位知情人士透露,OpenAI对英伟达最新的一些人工智能芯片并不满意,并且从去年以来一直在寻求替代方案,这可能使两家最受瞩目的公司之间的关系变得复杂[2] - 9月,英伟达表示计划向OpenAI投资高达1000亿美元,以获得该初创公司的股份,并为OpenAI提供购买先进芯片所需的资金[2] - 路透社报道称,这笔交易原本预计几周内就能完成,但谈判拖延了数月之久,在此期间OpenAI还与AMD以及其他旨在与英伟达竞争的GPU达成了合作协议[3] - 英伟达首席执行官黄仁勋驳斥了有关英伟达与OpenAI关系紧张的报道,称这种说法“毫无根据”,并表示英伟达计划对OpenAI进行巨额投资[3] 行业竞争格局与战略转变 - 英伟达的战略转变在于更加重视用于执行特定AI推理环节的芯片,AI推理是指AI模型响应用户查询和请求的过程[2] - 英伟达在用于训练大型AI模型的芯片领域仍然占据主导地位,而推理环节则成为竞争的新战场[2] - OpenAI和其他公司决定在推理芯片市场寻求替代方案,这标志着英伟达在人工智能领域的统治地位受到了重大考验[2] - 英伟达在一份声明中表示,客户继续选择英伟达进行推理,因为其能够大规模地提供最佳性能和总体拥有成本[3] - OpenAI的发言人表示,该公司依靠英伟达为其绝大多数推理集群提供动力,并且英伟达在推理方面提供了最佳的性价比[3] OpenAI对英伟达硬件的具体不满与替代方案 - 七位消息人士称,OpenAI对英伟达硬件在ChatGPT上针对特定类型问题(例如软件开发和人工智能与其他软件通信)给出答案的速度并不满意[3] - 一位消息人士告诉路透社,OpenAI需要新的硬件,最终以满足其未来约10%的推理计算需求[3] - ChatGPT的开发商OpenAI曾与Cerebras和Groq等初创公司探讨合作,以提供用于更快推理的芯片[4] - 英伟达与Groq达成了一项价值200亿美元的授权协议,导致OpenAI与Groq的谈判破裂[4] - OpenAI自去年以来一直在寻找GPU的替代方案,重点关注那些将大量内存(称为SRAM)嵌入到芯片同一块硅片上的公司[7] - 将尽可能多的昂贵SRAM集成到每个芯片上,可以为聊天机器人和其他人工智能系统处理数百万用户的请求提供速度优势[7] - 推理比训练需要更多内存,因为芯片需要花费更多时间从内存中获取数据,而不是执行数学运算,英伟达和AMD的GPU技术依赖于外部内存,这会增加处理时间,降低用户与聊天机器人交互的速度[7] OpenAI在特定产品上的性能挑战 - 在OpenAI内部,硬件性能问题在其用于创建计算机代码的产品Codex上表现得尤为突出,该公司一直在大力推广该产品[8] - 一位消息人士称,OpenAI员工将Codex的部分缺陷归咎于英伟达基于GPU的硬件[8] - 首席执行官Sam Altman表示,使用OpenAI编码模型的客户将“非常重视编码工作的速度”[8] - Altman表示,OpenAI满足这一需求的一种方式是通过其最近与Cerebras达成的协议,并补充说,对于ChatGPT的普通用户来说,速度并不是那么重要[8] - 像Anthropic的Claude和Google的Gemini这样的竞争产品受益于更多地依赖Google内部制造的芯片(称为张量处理单元或TPU)的部署,这些芯片专为推理所需的计算而设计,并且与英伟达设计的GPU等通用AI芯片相比,可以提供性能优势[8] 英伟达的应对措施与行业整合 - 在OpenAI明确表达了对英伟达技术的保留意见后,英伟达曾与包括Cerebras和Groq在内的多家研发大量使用SRAM芯片的公司接洽,探讨潜在的收购事宜[10] - Cerebras拒绝了英伟达的收购提议,并与OpenAI达成了上个月宣布的商业协议[10] - Groq曾与OpenAI就提供计算能力进行谈判,并吸引了投资者的关注,计划以约140亿美元的估值为其注资[10] - 到了12月,英伟达采取了非独家全现金交易的方式,获得了Groq的技术授权,虽然这项交易允许其他公司获得Groq的技术授权,但由于英伟达挖走了Groq的芯片设计师,该公司目前正专注于销售云端软件[10] - 芯片行业高管表示,英伟达收购Groq核心人才的决定,似乎是为了巩固其技术组合,从而在快速变化的AI行业中更好地竞争[5] - 英伟达在一份声明中表示,Groq的知识产权与英伟达的产品路线图高度互补[5]
股价突跌2.89%!路透:OpenAI对英伟达最新一些AI芯片不满意,寻求替代方案!英伟达AI主导地位迎重大考验!
美股IPO· 2026-02-03 07:15
文章核心观点 - OpenAI对英伟达最新的部分AI芯片性能不满意,自去年以来一直在为AI推理环节寻找替代方案,这可能使两家公司的关系复杂化,并标志着对英伟达市场主导地位的一次重大考验 [1][3][4][13] OpenAI的战略转变与需求 - OpenAI战略转变源于对AI推理芯片的重视程度不断提高,推理正成为AI竞争的新战场 [3] - OpenAI对英伟达硬件在某些特定问题上的响应速度不满意,例如软件开发和AI与其他软件的交互 [6] - OpenAI需要新的硬件,未来最终可满足其约10%的推理计算需求 [6] - 在OpenAI内部,基于英伟达GPU的硬件被部分员工认为是其编程模型Codex性能不足的原因之一 [9] 英伟达的应对与市场动态 - 英伟达首席执行官黄仁勋否认与OpenAI关系紧张,并表示仍计划对OpenAI进行巨额投资,但规模可能不及此前报道的1000亿美元 [6][12] - 英伟达曾接洽Cerebras和Groq等专注于高SRAM芯片的公司探讨潜在收购,Cerebras拒绝了收购提议并与OpenAI达成商业合作 [11] - 英伟达以一项非独家的全现金交易获得了Groq技术的授权,协议价值200亿美元,此举被认为是为了巩固其技术组合 [7][12] - 英伟达在声明中强调,客户在推理领域仍选择英伟达,因其提供了最佳性能和总体拥有成本 [6] 技术差异与市场竞争 - 英伟达GPU在训练大型AI模型领域占据主导,但推理对内存需求更高,可能成为AI发展的新阶段 [3][9] - OpenAI在寻找替代方案时,重点关注在同一块硅片上集成大量内存(SRAM)的芯片,这可在处理海量用户请求时带来速度优势 [9] - 与依赖外部内存的英伟达和AMD GPU相比,谷歌自研的专为推理设计的TPU在性能上可能更具优势,并被Anthropic的Claude等竞争产品更多依赖 [10] 合作、谈判与投资进展 - 去年9月,英伟达曾计划向OpenAI投入高达1000亿美元以换取股份,并为OpenAI提供购买芯片的资金 [6] - OpenAI在此期间已与AMD等公司达成协议,采购竞争性GPU,但其不断调整的产品路线图使与英伟达的谈判变得复杂且进展缓慢 [6] - OpenAI曾讨论与Cerebras和Groq等初创公司合作以获得更快推理速度的芯片,但英伟达与Groq的授权协议终止了OpenAI与Groq的谈判 [7] - 媒体此前报道英伟达向OpenAI投资1000亿美元的谈判已经破裂,但黄仁勋后来澄清公司“绝对”会参与OpenAI当前融资轮 [12] 市场反应与行业影响 - 消息导致英伟达股价在周一收跌近2.9% [5] - 分析师认为该消息损害了市场对英伟达关键客户OpenAI的情绪 [14] - 这些发展突显了英伟达在AI芯片市场的主导地位可能因主要客户探索特定需求的替代方案而面临挑战 [13]
2026年AI最大的叙事变化是什么?
华尔街见闻· 2026-02-02 21:33
行业焦点转变:从AI训练到推理 - 2026年可能成为AI推理工作负载超越训练的转折之年 [1] - 行业焦点正从训练转向能够真正带来投资回报的推理环节 [1] - 到2030年预计1.2万亿美元的AI资本开支中,推理最终可能占据多数份额或达75% [1][4] AI资本开支与芯片板块表现 - AI资本开支的持续增长正推动芯片板块强劲表现 [1] - 费城半导体指数(SOX)年初至今上涨约13%,创下过去20年中第二好的1月表现,远超标普500指数仅1%的涨幅 [1] - 这轮上涨由存储芯片、半导体设备商以及模拟芯片厂商引领,而非由计算领域龙头英伟达和博通推动 [1] - 超大规模云服务商强调AI投资对维持两位数增长至关重要,其表态为市场注入信心 [2] 主要芯片公司表现与前景 - 英伟达保持领先地位,拥有最广泛的产品管线,涵盖训练与推理领域,并具备供应保障优势 [5] - 博通与谷歌、Anthropic保持良好合作关系,并在OpenAI、苹果和xAI获得新机会 [5] - AMD作为英伟达通用芯片的可靠第二供应商 [5] - 存储和半导体设备供应商的机会持续存在,尽管近期大涨后波动性可能加大 [5] - 根据表格数据,年初至今部分公司股价涨幅显著:美光科技上涨45.4%,拉姆研究上涨36.4%,ASML上涨33.0%,应用材料上涨25.4%,英特尔上涨25.9% [2] 推理市场的芯片机会 - 推理工作负载需要一系列在成本和性能上优化的芯片解决方案 [4] - 从GPU、CPU到ASIC等多种硅解决方案都将在推理市场中找到定位 [3] - 市场对谷歌内部自研芯片风险的担忧被夸大,导致博通股价下跌过度 [5] - 市场对台积电2纳米制程的过度担忧导致AMD股价下跌,但该制程进展仍在正轨 [5] 光学连接与铜缆市场 - 光学收发器和组件供应商成为仅次于存储芯片的最强劲芯片板块表现者 [6] - 随着AI集群规模和带宽需求扩大,增加光学连接的必要性毋庸置疑 [6] - 除Meta外,超大规模云服务商对共封装光学的兴趣证据有限,原因是其运营复杂度更高 [6] - 据Lightcounting分析,CPO销售在2026/27年预计仅占约460亿美元以太网收发器市场的约1%(约5亿美元) [6] - 铜缆仍具相关性,建议买入主动电缆领导者Credo Technology Group [6]
专注推理,放弃训练!一家中国GPU公司要差异化突围
21世纪经济报道· 2026-02-02 17:56
全球AI算力市场趋势:推理成为新主战场 - 2025年全球大模型token消耗量增长了100倍,每一次消耗都对应一次AI推理,推理成本成为AI公司盈利的关键[1] - 根据德勤报告,到2026年,推理算力在整体AI计算中的占比将超过训练,达到66%,推理从技术配角转变为商业主力[1] - 大模型从“被训练出来”走向“被用起来”,推理需求被描述为“百花齐放”且“看不到天花板”[1][3] 曦望公司的战略定位与产品路径 - 公司选择All in推理、放弃训练,在行业普遍追求“训推一体”的背景下进行战略聚焦[1] - 公司于2025年初从商汤科技大芯片部门独立运营,一年内完成近30亿元战略融资,股东兼具产业龙头与国资背景[1] - 公司发布了新一代专注推理的GPU“启望S3”,其设计思路是做减法,放弃针对训练的冗余设计[5] 推理芯片的技术与设计逻辑 - 训推一体GPU为兼顾训练,采用昂贵的高级封装和HBM,但在推理场景下算力利用率仅5%到10%,导致高功耗和高成本[4] - 启望S3未采用HBM,而是选择成本更低、容量更大的LPDDR6内存,使得显存容量比上一代训推一体芯片提升四倍以上[5] - 芯片计算核心将算力向低精度倾斜,特别是FP4和FP8精度,通过加强FP4算力带来了数倍的性价比提升[6] - 结合架构、访存、软件栈等全方位优化,公司称S3能实现比上一代产品“十倍以上的性价比提升”[6] 行业竞争格局与国产芯片新趋势 - 行业正从集中式训练转向长期、大规模的推理场景,竞争核心转向效率、稳定性和长期成本[3] - 国产芯片创业趋势从“替代”转向“差异化”,单纯在“训推一体”通用赛道上追赶英伟达面临CUDA生态垄断、高研发投入等同质化竞争挑战[7] - 推理需求的爆发性增长(如智能体、多模态交互等)创造了新窗口,需求高度多样化且尚未收敛,没有公司能通吃所有场景[7] - 2025年底,英伟达以约200亿美元价格与AI芯片初创公司Groq达成非独家技术授权协议,以补强其在AI推理领域的技术[3] 生态构建与未来挑战 - 国产GPU生态面临巨大差距,Hugging Face上有200万个模型,而顶尖国产GPU能顺畅支持的只有几十到几百个,99%的中国AI应用仍建立在英伟达体系之上[8] - 国产芯片的突围必须是“芯片+生态+场景”的协同创新,公司正积极适配以DeepSeek为代表的国内大模型公司走出的不同技术路径(如MoE架构)[9] - 行业进入更为务实的“商业化验证”周期,最终取决于能否让更多企业用得起、用得好AI算力[10] - 公司管理层认为,AI芯片将占据未来AGI产业价值的70%甚至90%,相信未来7×24小时不停歇的推理需求将没有天花板[8]
英伟达砸1400亿,这一芯片风口来了
36氪· 2026-02-02 12:05
AI推理市场趋势与份额预测 - 至2030年,预计AI推理在整个AI计算市场将占到80%的份额 [1][2] - 聚焦于极致推理的AI芯片,未来会有更强的爆发性 [1][2] - 业内普遍认为,2026年全球AI推理的需求将超过AI训练场景 [1] 推理算力需求增长驱动因素 - 未来推理请求量与并发数将大幅增加,推理算力需求呈指数级攀升 [2][3] - 以智能体为代表的人工智能新应用爆发,AI智能体整体算力消耗可达同参数规模大语言模型的10倍以上 [3] - 对智能算力的需求呈数量级跃迁 [3] 行业龙头动向与战略收购 - 全球AI算力龙头正处于由训练转向推理的阶段 [4] - 英伟达以200亿美元(约合1400亿元)收购AI推理芯片初创企业Groq的技术授权,是其迄今规模最大的一笔收购 [2][4] - Groq专注极致推理,其LPU架构曾宣称推理性能是英伟达H100 GPU的10倍,而成本仅为其十分之一 [4] 国内外极致推理芯片厂商布局 - 美国有Etched.ai、Groq等主打极致推理芯片路线的企业,其核心逻辑是大模型架构已经收敛,因此专注于打造最快的AI推理芯片 [4] - 国内企业曦望Sunrise推出了聚焦于大模型推理的GPGPU芯片启望 S3,在主流大模型推理场景中,单位Token推理成本较上一代降低约90% [4] - 曦望联合商汤科技、第四范式等,发起“百万Token一分钱”推理成本计划,目标是把百万Token的推理成本降低至1分钱 [4] 训练与推理芯片市场格局对比 - AI训练芯片赛道逐渐收敛,已经变成头部玩家的游戏,能做预训练大模型的公司数量有限 [6] - 推理赛道尚未收敛,AI智能体、大语言模型、具身智能模型、世界模型等都需要芯片做推理任务 [6] - 相比英伟达在训练端一家独大,推理端技术路线呈现百花齐放态势,为国产AI芯片厂商带来机遇 [6] 国产AI芯片市场前景与估值 - 英伟达市值达到4万亿美元,而中国或许将出现多家市值数千亿甚至万亿人民币的GPU公司 [6] - 中国AI产业呈现区域化发展特征,国内不同GPU企业在各自优势地域市场占据主导 [6] - 互联网巨头除自研芯片外,也在采购国产芯片,并已形成深度合作伙伴关系 [6] - 即便以4万亿人民币计算,中国GPU市场依然蕴藏着巨大的增长空间 [6] AI应用落地与市场渗透加速 - AI应用的月活用户规模已经破亿,其增长速度和行业渗透率远超当年的互联网产品 [7] - 百度、腾讯宣布旗下AI应用将在今年春节期间发放数亿元红包,阿里通义千问也计划加入 [7] - 花旗研报表示,春节活动能有效帮助互联网大厂吸引关注,预计新春推广活动后,中国AI应用的普及进程有望进一步加速 [7] - 春节后,中国的AI渗透率、使用率会进一步提升,代表整个AI产业价值的提升 [9] AI产业价值分布与未来展望 - 在现阶段的AI产业架构中,最底层的芯片占据了整个AI产业价值70%甚至90% [10] - 展望未来,AI芯片或许仍会占据整体AGI(通用人工智能)价值的大头 [11] - 一旦AGI时代到来,机器人数量超过人类,需要进行7×24小时的推理,推理需求将没有天花板 [10] - 随着AGI时代来临,需要构建一个普惠的推理算力网络,服务于机器人、终端设备、消费者和企业 [10]
东吴证券:AIAgent落地速度正逐渐加速 CPU有望在Agent时代迎来大周期
智通财经网· 2026-02-02 11:25
文章核心观点 - AI Agent的加速落地与AI推理的快速发展,正从需求侧大幅拉动高端多核CPU的消耗,同时全球算力供应链的产能紧张与成本上涨从供给侧推高CPU价格,供需两侧因素共同驱动CPU产业有望迎来大周期 [1][2][3] CPU供需与价格趋势 - 受超大规模云厂商需求驱动,英特尔与AMD计划于2026年上调服务器CPU价格10%-15% [1] - 为确保利润,英特尔将核心先进制程产能大规模从消费端转向服务器,导致全球PC交付保证率大幅下滑,低端PC市场将面临供应不足 [1] - 2026年服务器CPU产能已基本售罄,公司将部分产能从PC端调配到服务器CPU以缓解供不应求 [4] 供应链成本上升因素 - DRAM生产转向HBM消耗更多晶圆,同时NAND需求攀升、交货期延长,库存告急,挤占了CPU晶圆材料供给 [2] - CPU部件PCB应用及加工材质的转变,使得钻针使用寿命缩短,消耗量暴增 [2] - CCL采用的树脂体系、玻纤布与铜箔匹配复杂,新进入者良率提升缓慢与客户认证周期长,导致有效产能释放缓慢,相关材料纷纷涨价 [2] AI发展对CPU需求的影响 - CPU负载正从“人类节奏”转向“机器节奏”,Agentic AI是动态推理、多步决策加外部工具调用的循环,比传统大模型调用更耗资源、负载更复杂、成本更高 [3] - 资源调用增长,加上为安全防范而产生的高频沙箱隔离开销,使得CPU资源消耗呈现指数级放大 [3] - Deepseek提出的Engram模块,提升了CPU用量 [3] 主要厂商战略调整 - 在英特尔2025年第四季度电话会议上,公司财务官表示正在尽可能将产能转向数据中心以满足强劲需求,表明在供应受限情况下优先满足服务器端需求 [4] - AMD在2025–2026年的服务器CPU市场份额快速增长,表明其正在将资源与产线重心从传统消费端向服务器、数据中心倾斜 [4] 相关投资标的 - CPU相关公司包括:澜起科技、海光信息、广合科技、龙芯中科、中国长城等 [4] - 数据库相关公司包括:星环科技(基于ARM优化,与NV-GPU-GraceCPU适配) [4]
最稳定的Memory、液冷产业信息
傅里叶的猫· 2026-01-30 23:50
闪迪公司最新财务与业务表现 - 公司第三财季总营收达30亿美元,环比增长31% [1] - 公司第三财季毛利率达51.1%,环比提升21个百分点 [1] - 公司数据中心业务营收环比大增64%,占总营收的15% [1] - 管理层预计后续季度将完成更多超大规模云服务商的认证工作 [1] - 公司对FY3Q26的营收指引中点为46亿美元,每股收益指引为13美元,贴合市场高位预期 [1] NAND/SSD行业需求的底层逻辑 - 以存代算:存储成为AI推理关键使能器,通过KV Cache持久化降低算力消耗 [3] - Sandisk CEO提及token intensity在加速,并估算KV cache在2027年将带来额外75-100 EB需求,一年后翻倍 [3] - 数据生成主体改变:从人类生产转向模型自生成,不受物理边界限制 [3] - Sandisk提及数据增长因“数据温度上升”而加速,对应更多数据值得被持久化存储 [3][4] - 数据重用价值提升:LLM/RAG技术唤醒历史数据,使存储率从过去的1%大幅提升 [8] - 企业级SSD加速采用,数据中心预计在2026年成为NAND最大市场,带来高60s Exabyte增长 [8] - 相同语义密度下的数据通胀:数据从明文转为embedding、KV、多模态后,容量膨胀5-1000倍 [8] - Sandisk确认AI工作负载导致存储内容要求大幅提升,与数据通胀逻辑方向一致 [8] 行业趋势与定位演变 - 四大需求逻辑叠加,使SSD/NAND从冷存外设转变为持久化算力资产 [5] - SSD/NAND的增长与GPU/HBM解耦,正独立跑出其自身的Alpha增速 [5]
平头哥芯片卖爆了!
国芯网· 2026-01-30 21:58
平头哥“真武”PPU芯片市场表现与产品信息 - 阿里巴巴旗下芯片业务平头哥的“真武”PPU芯片总出货量已达数十万片,超越寒武纪,在中国国产GPU厂商中处于领先地位[2] - 该芯片已在阿里云实现多个“万卡集群”部署,服务中国国家电网、中国科学院、小鹏汽车、新浪微博等超过400家客户[4] - 市场呈现供不应求状态,在业内口碑良好[4] “真武”PPU芯片技术规格与性能 - 芯片采用自研平行运算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研[4] - 存储器为96G HBM2e,片间互联带宽达到700 GB/s[4] - 可应用于AI训练、AI推理和自动驾驶领域[4] - 对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流中国国产GPU,与英伟达H20相当[4] “真武”PPU芯片的应用与生态 - 阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理[4] - 结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务[4] 平头哥公司背景与产品线 - 平头哥成立于2018年9月,是阿里巴巴集团全资半导体芯片业务主体,用以推动阿里对云端一体化的芯片布局[4] - 除真武810E外,平头哥主要产品还包括含光800 AI推理芯片、倚天710 Arm服务器CPU、镇岳510 SSD主控芯片以及羽阵超高频RFID电子标签芯片[5]
西部数据电话会:2026年产能已售罄,长约签署到2028年,AI推理正在重塑HDD估值体系
硬AI· 2026-01-30 20:45
核心观点 - 得益于价格上涨和成本下降的“剪刀差”,公司毛利率显著提升至46.1%,且增量毛利率高达约75%,盈利能力进入黄金收割期 [2][9] - 公司产能极度紧张,2026年产能已全部售罄,并与前五大客户中的三家签署了长期协议,其中两份至2027年,一份至2028年,锁定了未来的量和价 [2][4][11][13] - AI发展正从模型训练转向推理应用,推理过程将产生海量新数据,驱动对低成本HDD存储的结构性需求,为公司HDD业务带来新的增长故事 [2][19][26] - 为应对供应紧张和满足客户需求,公司已将下一代HAMR技术的客户验证时间表提前了半年,并预计其量产初期对毛利率的影响为中性甚至增益 [17][57] 财务表现与盈利能力 - **营收与利润**:2026财年第二季度营收为30.2亿美元,同比增长25%,调整后每股收益为2.13美元,同比增长78% [3][37] - **净利润**:第二财季净利润达到18.4亿美元,较去年同期的5.94亿美元增长210% [4] - **毛利率**:第二财季毛利率为46.1%,同比提升770个基点,环比提升220个基点 [35] - **增量毛利率**:CFO确认增量毛利率在75%左右,主要得益于每TB价格上涨2-3%以及每TB制造成本同比下降10%的“剪刀差”效应 [2][7][8][42][43] - **业务构成**:云业务占总收入的89%,达27亿美元,同比增长28%;客户端业务占6%,为1.76亿美元;消费级业务占5%,为1.68亿美元 [34][36] - **现金流与资本回报**:经营现金流为7.45亿美元,自由现金流为6.53亿美元,自由现金流利润率为21.6%;本季度股票回购额为6.15亿美元,自资本回报计划启动以来已向股东返还14亿美元 [37] 市场需求、产能与长期协议 - **产能状况**:2026自然年的产能已全部售罄,前七大客户2026自然年的确定性订单已全部锁定 [4][11][45] - **长期协议**:已与前五大客户中的三家签署了长期协议,两家至2027年,一家至2028年,这些协议同时包含了价格和数量条款 [2][11][13][63] - **需求驱动**:AI推理应用的普及将生成海量新数据,超大规模数据中心正将大量推理数据回流至HDD,这被视为对HDD的结构性利好 [2][19][20][59] - **出货数据**:当季向客户交付了215 EB的数据,同比增长22%,其中包括超过350万块、总计103 EB的最新一代ePMR硬盘 [33] 技术路线与产品进展 - **HAMR技术**:已将HAMR技术的首个超大规模客户验证时间表从原计划提前了半年,已于2026年1月启动验证 [17][55] - **技术信心**:管理层预计HAMR开始量产后,其起步阶段的毛利率将与现有ePMR技术持平甚至带来增益,不会拖累整体盈利能力 [17][57] - **ePMR产品**:最新一代ePMR产品(容量高达26TB CMR和32TB UltraSMR)上季度出货量超过350万块,良率在90%出头 [27][54] - **UltraSMR占比**:在近线产品组合中,UltraSMR的占比已超过50%,预计将继续增加,这对公司利润率非常有益 [51] - **创新与投资**:公司收购了相关知识产权以发展内部激光器能力,并对量子硬件公司Colab进行了战略投资 [28][29] 未来展望与战略 - **下季度指引**:预计第三财季营收为32亿美元(±1亿美元),毛利率在47%至48%之间,稀释后每股收益为2.30美元(±0.15美元) [38] - **资本配置**:公司专注于股票回购,自2025年5月宣布20亿美元回购授权以来已使用13亿美元,并计划将持有的闪迪股票变现以进一步减少债务 [47][50] - **客户关系**:公司转向以客户为中心的模式,为大型超大规模客户设立专门团队,深化了技术路线图合作和需求可见性,从而促成了更长期的协议 [49] - **行业活动**:计划于2月3日在纽约举办创新日活动,分享HAMR和ePMR的更新路线图以及财务模型 [28]