Workflow
英伟达GPU
icon
搜索文档
忽略“春节AI大战”吧,AI的入口之争胜负早已明了
36氪· 2026-02-10 09:34
AI入口竞争策略与市场反应 - 市场普遍认为AI入口竞争本质是市场费用的较量 尤其体现在春节红包大战中 但阿里千问App选择了一条不同的路径 通过“春节30亿大免单”活动进行AI生活和购物的全民科普 活动上线9小时下单量突破1000万单 [1] - 阿里千问App的现象级表现并非单纯预算的胜利 而是其长期战略布局的结果 [1] 全栈式AI战略路径对比:谷歌与阿里 vs. 微软 - 谷歌采取全栈自研战略 涵盖TPU芯片、模型训练、云计算及C端产品Gemini 而微软则依赖与OpenAI合作及采购英伟达算力 战略路径不同导致市场表现分化 [2] - 2025年Q4以来 微软市值较巅峰下跌30%以上 而谷歌市值接近4万亿美元 超出微软近1万亿美元 [2] - 谷歌在TPUv5e、TensorFlow及Gemini协同下 训练成本降低67% 推理速度提升2.3倍 支撑Gemini 3多模态能力领先 这是微软不具备的长期投入能力 [3] - 阿里是全球唯二的全栈AI公司 战略布局最接近谷歌 其战略认为大模型将替代OS成为下一代操作系统 并运行于AI Cloud之上 [4] - 阿里实施两大AI战略:千问大模型坚持开源开放 打造“AI时代的Android” 同时打造AI超级计算机提供智能算力网络 [4] - 2025年春天 阿里提炼“通云哥”战略 由通义实验室、阿里云、平头哥构成 涵盖大模型研发训练、云计算和芯片产业 [4] - 阿里宣布未来三年投入3800亿元于AI资本开支 近期传闻追加1000亿元 预计到2032年 阿里云全球数据中心能耗规模将比2022年提升10倍 [5] 全栈AI能力的具体成果 - 平头哥PPU芯片总出货量达数十万片 其中“真武810E”芯片性能超过英伟达A800和主流国产GPU 与英伟达H20相当 [6] - 阿里通义旗舰模型Qwen3-Max性能超过GPT-5和Claude Opus 4 跻身全球前三 Qwen3.5已提交代码合并申请至HuggingFace Transformers库 [6] - 2025年后的大模型竞争已上升至生态之争 涉及算力、云计算、芯片及用户场景的综合实力 [9] 资本市场对全栈AI公司的定价与分化 - 过去一年 阿里与谷歌股价走势非常接近 表明资本市场对两者“全栈式AI”的定性接近 [12] - 自2026年1月后 阿里股价走势开始独特:与恒生科技指数相关性变弱 显示其路径独立于国内同类企业 并在2026年前后出现一轮较大反弹 迥异于谷歌的大幅下挫 [12] - 2026年1月15日 千问宣布接入淘宝闪购、支付宝、淘宝、飞猪、高德等阿里生态场景 测试AI购物功能 使C端产品直接与真实物理世界挂钩 [12] AI应用从效率工具向生活消费场景泛化 - 海外ChatGPT的会话主题中 工作与教育等“生产力”类别占比从2024年Q2的近50%下降至2025年Q2的37% 而健康、理财、旅行、娱乐等生活类场景占比从22%提升至35% [13] - 这表明AI正从效率工具泛化为生活方式 正在形成由AI驱动的下一代消费操作系统 [13] - 阿里千问App的30亿元补贴活动上线9小时订单量超1000万单 被认为能有效缓解现制饮品行业竞争格局 该行业近一年新开9.2万家门店但净减少3.5万家 总门店数39.9万家 [13] - 自2026年1月开始 阿里股价走出了与谷歌完全不同的走势 [14]
AI 竞赛终局:电力说了算?
36氪· 2026-02-09 20:28
文章核心观点 - AI算力需求的指数级增长与美国老化的电力基础设施形成结构性矛盾,导致北美地区面临严重的“缺电危机”,这已从芯片竞争演变为能源竞争 [1][2][4][91] 美国用电需求:制造业回流与AI算力爆发开启新一轮上行周期 - **需求历史性拐点**:美国电力需求在2021年后进入“重启增长期”,2021-2024年平均增速回升至1.5%左右,主要驱动力为制造业回流与AI数据中心爆发 [8] - **电价与容量价格飙升**:2025年底,美国最大区域电网PJM的容量拍卖价格从$28.92/MW-day暴涨至$269.92/MW-day,涨幅达9倍,反映市场从“风险溢价”转向“生存恐慌” [4] - **用电结构变化**:商业用电是增长核心引擎,其中数据中心是绝对主力,截至2024年底美国数据中心负荷约35GW,较2020年翻番;工业用电因高端制造业回流提供支撑 [11] - **核心矛盾转移**:AI竞赛的胜负手从芯片转向发电厂,行业领袖指出供电能力是当前最大瓶颈,甚至超过芯片 [4] AI数据中心带来的电力需求冲击 - **驱动因素:资本开支爆发**:以亚马逊、微软、谷歌、Meta为代表的北美四大云计算服务商(CSP)总资本开支从2023年的约1500亿美元飙升至2025年预计的4060亿美元,年复合增长率超60% [20] - **驱动因素:单点功耗飙升**:AI芯片进入高算力推动大能耗时代,英伟达GPU单芯片热设计功耗从H100的700W跃升至Blackwell架构的1200W-1400W,预期下一代Rubin架构将突破2000W+ [26] - **驱动因素:集群规模指数级扩大**:AI数据中心部署规模正从“千卡级”迈向“十万卡级”,例如规划的“Stargate”项目预计部署超45万颗GB200芯片,总用电负荷或将突破1.2GW [28][29] - **负荷特性根本改变**:AI数据中心从传统“潮汐波动”的弹性负荷转变为“刚性满载”的冲击性负荷,训练时近乎24小时满载运行(峰值负荷率>90%),且存在毫秒级功率剧烈跳变风险,对电网构成巨大挑战 [16][33][34] 未来五年北美电力需求预测 - **数据中心负荷预测(美国)**:基于在建和规划数据,预计2026-2030年间美国数据中心将释放80GW新增容量,总容量增至124GW,年复合增长率达23% [38] - **总峰值负荷预测**:综合AI数据中心与基础负荷(制造业回流、电气化)增长,给予北美市场未来5年总新增峰值负荷在悲观/中性/乐观假设下分别为105GW、140GW、180GW的预期 [52] - **供给侧验证**:根据美国联邦能源监管委员会(FERC)数据,北美电力公司大幅上调未来5年峰值负荷预期,规划总增量高达166GW,其中数据中心预计贡献90GW负荷增量 [48] 电力供给端:能源侧与电网侧的双重瓶颈 - **能源侧:高可靠基荷持续流失**:过去十年,以煤、气、水、核为代表的传统可调度基荷能源整体装机相比2011年缩减了77GW,系统可靠性根基被削弱 [56] - **能源侧:增量电源结构错配**:填补退役空缺的主要是风电和光伏等间歇性能源,2011-2024年间装机从不足50GW激增5.5倍至329GW,但仅实现“电量替代”而非“容量替代” [61] - **能源侧:有效容量严重不足**:预计未来5年美国新增电力装机337GW中,超过76%为间歇性电源(约257GW),稳定可调度的天然气发电新增仅80GW。经有效容量系数折算后,净新增的有效净容量仅有约28GW,近90%的名义装机增量在顶峰时刻无法提供可靠保障 [65] - **能源侧:确定性的可靠性缺口**:结合需求增长与供给能力,预测到2030年美国电力系统在低、中、高需求情景下的可靠性缺口规模将分别达到109GW、149GW和195GW [67] - **电网侧:基础设施严重老化**:美国70%输电线路及电力变压器运行年限在35年以上,约30%的核心资产(如断路器)已突破设计寿命,系统可靠性大幅减弱 [70][72] - **电网侧:投资长期低位**:过去10年美国电网年均投资约200亿-300亿美元,2024年才首次突破300亿美元,且投资主要流向老化设备更换,由负荷增长驱动的扩容性投资占比极低 [73] - **电网侧:关键设备短缺**:电力变压器高度定制化且本土产能不足,目前仅能满足约30%的需求,预计到2027年也仅能满足约40%,导致交付周期从6-9个月拉长至2-3年,成为电网快速扩容的瓶颈 [80] - **电网侧:建设周期严重错配**:AI数据中心建设周期为1-2年,但配套电网扩容需5-7年甚至更久,导致并网队列严重拥堵,全美并网排队中位数已接近5年,在弗吉尼亚州等核心区甚至长达7年 [86][90]
联发科组千人军团,攻一类芯片
半导体芯闻· 2026-02-09 18:10
公司战略与业务转型 - 联发科董事长蔡明介亲自督军,将公司战略重点转向AI相关客制化芯片业务,以把握AI大趋势带来的商机[2] - 为加速ASIC开发,公司已调动手机芯片研发部门上千人的团队转调至ASIC开发部门,且调动人数仍在增加[4] - 公司2024年ASIC业务的营收目标为冲击10亿美元[3] 市场表现与驱动因素 - 2024年1月下旬,联发科股价连续飙涨并创下历史新高,市值达到2.85兆元新台币[2] - 股价逆势上涨的关键驱动力在于董事长蔡明介布局多年的ASIC业务即将进入丰收期,抵消了手机芯片出货可能下调的负面影响[2] - 包括Google、亚马逊、微软和Meta在内的云端服务提供商希望摆脱对英伟达的依赖,转而寻求与联发科等公司合作开发替代性AI芯片,这为联发科的ASIC业务创造了巨大需求[3] 行业趋势与市场前景 - 市场调查机构Counterpoint Research预测,AI服务器ASIC芯片出货量到2027年将较2024年增长3倍,增长幅度惊人[3] - 到2028年,AI服务器ASIC芯片出货量有望达到一千五百多万颗,并有机会超越英伟达GPU的出货量[3] - 公司认为,相较于5G技术已成熟且电信运营商投资回收不足,云端服务提供商对ASIC的需求更为迫切,能带来更好的出货量与营业额机会[4] 客户合作与竞争格局 - 联发科已获得Google的首张ASIC大单[2] - 公司同时与英伟达创始人黄仁勋合作,共同抢攻AI PC市场[2] - 在AI芯片市场,联发科与博通、迈威尔等IC设计公司一同被云端服务提供商视为可帮助开发替代英伟达AI芯片的合作伙伴[3]
下一个英伟达,会是谁?
半导体芯闻· 2026-02-06 18:12
文章核心观点 - 市场而非政府政策是发现和培育下一个类似英伟达的科技巨头的关键 成功的增长战略需要私营部门主导、放松管制、保持开放与多元化 并容忍大量失败 [1][4][5] 对英伟达的评论与潜在挑战者 - 东京大学教授江崎博史评论英伟达股价“不可能那么高” 并比喻其像一辆耗油量大、噪音大但很酷的老式美国汽车 [1] - 英伟达的GPU最初为游戏开发 虽计算速度快 但会并行执行许多不必要计算 消耗大量电力 [1] - 江崎教授认为未来两到三年内 总部位于加州帕洛阿尔托的SambaNova Systems是一家有前途的潜在公司 [1] - SambaNova的AI产品设计将“思考”和“记忆”功能集成于单个芯片 减少了与外部数据传输相关的时间和功耗损失 被比喻为节能的日本汽车 [2] - SambaNova展示了一种可能部分取代英伟达GPU统治地位的设计理念 [2] 投资机会与相关资本动态 - 英伟达股价在1月底为191美元 两年前买入的投资者股价已翻三倍 一年前买入的投资者获得约60%收益 [2] - SambaNova在2021年获得了软银愿景基金2、新加坡淡马锡和美国贝莱德的投资 [2] - 软银愿景基金2有时被称为“最后的投资者” 因其常在IPO前注入大笔资金导致估值飙升 使后续投资者难以参与 [2] - 英特尔首席执行官陈立武(Lip-Bu Tan)曾参与SambaNova 2017年的种子轮融资和2018年的A轮融资 [3] - 此前有报道称英特尔正以16亿美元收购SambaNova进行最终谈判 但上个月报道称谈判已陷入僵局 [1][3] 日本产业政策与竞争力分析 - 日本首相高市早苗的内阁在11月选定了17个战略领域进行投资集中 包括人工智能和半导体、造船和量子技术等 [3] - 2025财年补充预算中 为这些领域共拨款7.1万亿日元(452亿美元) 相当于1.4年的食品消费税收入 [3] - 其中资金投入最多的领域是灾害预防和国家韧性(主要包括道路维护等公共工程项目) 金额达2.9万亿日元 [3] - 日经新闻12月对100位日本商界领袖的调查显示 80%的受访者对这17个领域的投资抱有很高期望 [3] - 基于调查和AI模型的分析表明 日本明显的竞争优势仅限于内容(包括动漫和电子游戏)、灾害预防和国家韧性等少数领域 在许多领域落后于中国 [3] - 历史学家约翰·诺伯格认为国家产业政策往往只是追逐潮流 并以日本第五代计算机系统项目和日本显示器公司为例 指出政府认定的增长领域最终市场发展方向不同 [4] - 文章质疑高市的17个领域是否也只是在追逐潮流 并指出软银孙正义和英特尔陈立武早在数年前投资SambaNova 展现了超越这17个领域框架的远见 [4] 提升竞争力的关键要素 - 江崎教授指出 提升竞争力、打造下一个英伟达 私营部门的领导作用至关重要 [4] - 放松管制是关键一点 特别是在自动驾驶等新兴产业 现有产业的监管正在阻碍发展 政府的重要作用是改变规则并给予明确许可 [4] - 创新离不开多元化 对外部世界持开放态度是其基本前提 并以英伟达黄仁勋、SambaNova梁罗德和英特尔陈立武的出生背景 以及江崎实验室近40%研究生为国际学生为例 [4] - 江崎教授实验室本科生中休学创业的人数接近两位数 并希望政府不要溺爱学生创业者 [5] - 政府无法预见下一个英伟达 成功的关键在于保持谦逊 容忍大量失败 并相信市场会决定最终赢家 [5]
1596亿,AI芯片超级独角兽诞生
36氪· 2026-02-05 13:15
融资与估值 - 美国AI芯片公司Cerebras Systems完成10亿美元F轮融资 投后估值达到230亿美元 [1] - 本轮融资由Tiger Global领投 Benchmark、Fidelity、AMD等多家知名投资机构跟投 [1] - 相比2025年9月G轮融资后的81亿美元估值 最新估值增长近184% [3] 技术与产品 - 公司以晶圆级引擎3(WSE-3)芯片闻名 该芯片是全球最大、速度最快的AI芯片 体积是当前最大GPU的56倍 [1] - WSE-3芯片单位计算功耗远低于同类产品 推理和训练速度比竞品快20倍以上 [1] - 其芯片架构将运算都保存在芯片内部 消除了GPU在芯片与内存间传输数据导致的内存带宽瓶颈 专为处理AI推理的顺序执行、内存密集型工作负载优化 [3] - 公司硬件运行AI模型的速度据称比英伟达的系统快数倍 [4] 客户与商业合作 - 公司与OpenAI达成一项商业协议 将为OpenAI客户提供由Cerebras托管的计算服务 [4] - 协议涉及部署750兆瓦规模的Cerebras晶圆级系统 基础设施从2026年开始分阶段建设 预计持续到2028年 将成为全球规模最大的高速AI推理部署项目 [4] - 知情人士透露 该协议价值超过100亿美元 [4] - 公司自2017年以来一直与OpenAI探索合作 其上的大语言模型能比基于GPU的系统快15倍地响应 [5] - 公司向Meta、IBM、Mistral AI等客户提供远程计算服务 [4] 行业竞争与趋势 - OpenAI正在寻找英伟达AI推理芯片的替代方案 考虑对象包括Cerebras、AMD和Groq [4] - 英伟达曾与Cerebras等公司接洽探讨潜在收购 但Cerebras拒绝了收购 [4] - 英伟达此后与Groq签署授权协议并吸纳其大量芯片人才 提振了业界对AI芯片企业的热情 [4] - 过去6个月 谷歌、Anthropic、英伟达、OpenAI等4家AI领域重要公司均未选择英伟达硬件进行推理加速投资 转而采用或投资其他方案 [6] - 这些收购和投资标志着硬件向更新、最先进的AI优化硬件设计过渡的开始 [6] 公司背景与投资者 - 公司成立于2015年 [1] - 此轮融资是公司自2025年10月撤回美国IPO申请以来的首轮融资 凸显企业因私有市场资本充足而保持私有状态更长的趋势 [3] - 公司历史投资方包括高通、台积电等芯片巨头 以及Sam Altman、Ilya Sutskever等多位知名科技界个人投资者 [3]
千亿“缩水”至200亿!英伟达与OpenAI“AI联盟”现裂痕?
格隆汇APP· 2026-02-04 19:38
文章核心观点 - 英伟达与OpenAI之间备受瞩目的千亿美元级战略合作一度陷入停滞传闻,引发市场恐慌,但最新进展显示双方关系缓和,英伟达即将敲定一笔200亿美元的投资,这仍是其史上最大单笔投资,而千亿美元投资的长期计划据称仍在按部就班进行 [1][3][4] - 这场合作风波揭示了AI行业正从狂热扩张期转向理性发展阶段,资本将更关注投资回报与商业可行性,企业从追求算力规模转向优化算效比与商业化落地,行业竞争格局也可能从一家独大走向多极化 [17][18][19] 合作背景与初始计划 - 合作始于2023年9月,英伟达与OpenAI高调签署非约束性战略合作意向书,计划联手部署至少10吉瓦算力的英伟达系统,投资规模最高达1000亿美元,并由英伟达独家为OpenAI供应数据中心芯片 [6][7] - 合作本质是双向奔赴:英伟达旨在锁定OpenAI这一核心大客户以巩固其AI算力垄断地位;OpenAI则急需海量资金和算力支撑下一代大模型研发与商业化 [8] 合作波折与市场传闻 - 2025年11月的SEC文件显示交易并未最终敲定,随后市场传出“合作被搁置”的消息,引发恐慌 [13] - 传闻称OpenAI“嫌弃”英伟达AI芯片,而英伟达内部则对OpenAI商业模式的可持续性及竞争压力存疑 [2] - 英伟达CEO黄仁勋最终坦言,千亿美元投资并非约束性承诺,公司只会逐步投资,不会一次性投入巨款 [13] 最新进展与双方表态 - 2025年2月2日,OpenAI CEO山姆·奥特曼在社交平台主动示好,称赞英伟达AI芯片全球顶尖,并称OpenAI未来很长一段时间都会是其大客户 [14] - 黄仁勋随后在采访中“辟谣”,称千亿美元投资“一切正常、按部就班”,否认停滞传闻,并表示英伟达一定会参与OpenAI下一轮最高1000亿美元的融资,以及未来的IPO [4][15] - 最新消息称,英伟达即将敲定一笔200亿美元投资OpenAI的新协议,虽较千亿意向大幅缩水,但仍是英伟达有史以来最大单笔投资 [3] 行业影响与未来趋势 - 短期影响有限:即使英伟达缩减部分投资规模,也主要间接影响OpenAI的算力采购,全球AI算力需求仍在疯涨,吉瓦级算力项目可采用分阶段落地模式 [16] - 行业走向理性:风波标志着AI行业告别狂热,资本将不再盲目“烧钱换规模”,而是更看重投资回报和商业可行性 [17] - 企业战略转变:AI企业将从一味追求算力规模,转向优化算效比和深耕商业化落地 [18] - 竞争格局演变:AI芯片市场将不再是英伟达“一家独大”,AMD、博通等竞争对手将趁机崛起,形成多极化竞争格局 [18] - OpenAI的多元布局:OpenAI已与微软、亚马逊等科技巨头签署累计1.4万亿美元的潜在合作协议,为其提供了充足后路 [11] - OpenAI与竞争对手合作:OpenAI与AMD、博通等英伟达竞争对手的合作,主要是为了突破算力瓶颈、优化运营成本,并非要彻底脱离英伟达 [15]
英伟达GPU,被嫌弃了
新浪财经· 2026-02-04 10:27
文章核心观点 - OpenAI对英伟达部分最新AI芯片在推理性能上不满意,自去年以来积极寻求替代方案,这为两家在AI热潮中关系最紧密的公司之间的合作与投资谈判带来了复杂性 [1] - 英伟达在AI训练芯片领域占据主导,但AI推理正成为竞争新战场,OpenAI等公司的替代方案寻求标志着英伟达的统治地位面临考验 [1] - 尽管双方高管公开否认关系紧张,但谈判拖延、OpenAI与竞争对手达成协议、以及英伟达收购潜在竞争对手技术等行动,揭示了底层竞争与合作的动态博弈 [2][3][6] OpenAI的战略与行动 - OpenAI对英伟达硬件在ChatGPT处理特定类型问题(如软件开发和AI与其他软件通信)时的回答速度不满意 [2] - 公司需要新的硬件来满足其未来约10%的推理计算需求 [2] - 自去年以来,OpenAI一直在寻找GPU的替代方案,重点关注将大量SRAM内存嵌入同一芯片硅片上的公司,以提升处理用户请求的速度 [4] - 在内部,Codex(用于创建计算机代码的产品)的性能问题尤为突出,部分员工将其归咎于英伟达基于GPU的硬件 [5] - 公司已与AMD以及其他旨在与英伟达竞争的GPU公司达成合作协议 [2] - 公司曾与Cerebras和Groq等初创公司探讨合作,以提供用于更快推理的芯片 [3] - 公司已与Cerebras达成商业协议,以满足编码工作对速度的重视需求 [5] 英伟达的应对与市场动态 - 英伟达计划向OpenAI投资高达1000亿美元,以换取股份并为OpenAI提供购买先进芯片的资金 [1] - 英伟达首席执行官黄仁勋驳斥了关系紧张的报道,称其“毫无根据” [2] - 公司声明强调客户因其能大规模提供最佳性能和总体拥有成本而继续选择英伟达进行推理 [2] - 在OpenAI表达对技术的保留意见后,英伟达曾与Cerebras和Groq等公司接洽探讨潜在收购,Cerebras拒绝了收购提议 [6] - 英伟达与Groq达成了一项价值200亿美元的非独家全现金授权协议,获得了Groq的技术,并挖走了其芯片设计师 [3][6] - 公司表示Groq的知识产权与其产品路线图高度互补 [3] AI芯片行业技术趋势与竞争格局 - AI发展重点正从训练大型模型转向利用训练好的模型进行推理,这可能是AI发展的一个全新、更宏大的阶段 [4] - 推理比训练需要更多内存,因为芯片需要花费更多时间从内存中获取数据 [4] - 英伟达和AMD的GPU技术依赖于外部内存,这会增加处理时间,降低与聊天机器人交互的速度 [4] - 将大量昂贵SRAM集成到每个芯片上,可以为处理数百万用户请求提供速度优势 [4] - 竞争对手如Anthropic的Claude和Google的Gemini,更多地依赖Google内部制造的专为推理设计的张量处理单元(TPU),相比通用GPU可提供性能优势 [5] - Groq曾吸引投资者关注,计划以约140亿美元的估值进行融资 [6]
OpenAI不满英伟达芯片?两高管隔空反驳
36氪· 2026-02-03 15:40
文章核心观点 - 市场传言OpenAI对英伟达最新AI芯片在推理任务上的性能不满并寻求替代方案 凸显了AI推理正成为芯片竞争的新战场 尽管两家公司CEO均公开反驳了关系紧张的传言 [1] AI推理成为竞争新焦点 - AI推理是指AI模型响应用户查询的过程 如今AI进步越来越侧重于将训练好的模型用于推理和判断 这可能是一个全新且更大的发展阶段 [2] - 推理所需的内存比训练更多 芯片需要花费相对更多时间从内存中获取数据 而非执行数学运算 [2] - 英伟达和AMD的GPU技术依赖外部内存 这会增加处理时间并减慢用户与聊天机器人互动的速度 [2] - 竞争对手如Anthropic的Claude和谷歌的Gemini更多依赖谷歌内部制造的TPU芯片 这些芯片专为推理设计 相比英伟达的通用AI芯片更具性能优势 [2] OpenAI对英伟达芯片的具体不满 - 英伟达芯片的短板在OpenAI用于生成代码的“Codex”产品中表现明显 OpenAI员工将Codex的一些不足归咎于基于英伟达GPU的硬件 [3] - OpenAI首席执行官萨姆·阿尔特曼表示 使用其编码模型的客户“会非常看重编码工作的速度” [3] - OpenAI对英伟达硬件在为ChatGPT用户解决特定类型问题(如软件开发和AI与其他软件交互)时提供答案的速度表现不佳感到不满 [4] - OpenAI需要新的硬件来满足其未来约10%的推理计算需求 [4] OpenAI的替代方案与行业动态 - 为满足对速度的需求 OpenAI采取的应对措施之一是推进其最近与Cerebras的合作 [3] - 在投资谈判拖延期间 OpenAI与AMD等其他公司达成协议 以生产与英伟达竞争的GPU [4] - OpenAI曾与包括Cerebras和Groq在内的初创公司讨论合作 以提供用于更快推理的芯片 [5] - 英伟达后来与Groq达成了一项价值200亿美元的授权协议 这导致OpenAI与Groq的谈判破裂 [5] - 芯片行业高管表示 英伟达收购Groq的决定似乎是为了加强其技术组合 以便在快速变化的AI和芯片行业中更具竞争力 [5] 双方公司的公开立场与合作关系 - 英伟达CEO黄仁勋驳斥了与OpenAI关系紧张的报道 称其“纯属无稽之谈” 并表示英伟达计划对OpenAI进行大规模投资 [6] - 英伟达声明称 客户继续选择英伟达进行推理操作 因为其在大规模应用中提供了最佳的性能和总体拥有成本 [6] - OpenAI发言人声明 公司依靠英伟达驱动其绝大多数的推理设备 并且英伟达在每美元的成本效益方面为推理操作提供了最佳表现 [6] - OpenAI CEO萨姆·阿尔特曼表示 公司喜欢与英伟达合作 并且他们生产世界上最好的AI芯片 希望在很长一段时间里成为其超级大客户 [6] 双方的投资谈判与潜在变数 - 英伟达和OpenAI正处于投资谈判阶段 去年9月英伟达曾表示计划向OpenAI投资多达1000亿美元 以换取股份并提供购买先进芯片的资金 [4] - 该交易原预计数周内完成 但谈判拖延了数月之久 [4] - 业内人士透露 OpenAI不断变化的产品路线图改变了其所需的计算资源类型 并使它与英伟达的谈判陷入僵局 [4]
英伟达GPU,被嫌弃了
半导体行业观察· 2026-02-03 09:35
OpenAI与英伟达的关系与合作动态 - 据八位知情人士透露,OpenAI对英伟达最新的一些人工智能芯片并不满意,并且从去年以来一直在寻求替代方案,这可能使两家最受瞩目的公司之间的关系变得复杂[2] - 9月,英伟达表示计划向OpenAI投资高达1000亿美元,以获得该初创公司的股份,并为OpenAI提供购买先进芯片所需的资金[2] - 路透社报道称,这笔交易原本预计几周内就能完成,但谈判拖延了数月之久,在此期间OpenAI还与AMD以及其他旨在与英伟达竞争的GPU达成了合作协议[3] - 英伟达首席执行官黄仁勋驳斥了有关英伟达与OpenAI关系紧张的报道,称这种说法“毫无根据”,并表示英伟达计划对OpenAI进行巨额投资[3] 行业竞争格局与战略转变 - 英伟达的战略转变在于更加重视用于执行特定AI推理环节的芯片,AI推理是指AI模型响应用户查询和请求的过程[2] - 英伟达在用于训练大型AI模型的芯片领域仍然占据主导地位,而推理环节则成为竞争的新战场[2] - OpenAI和其他公司决定在推理芯片市场寻求替代方案,这标志着英伟达在人工智能领域的统治地位受到了重大考验[2] - 英伟达在一份声明中表示,客户继续选择英伟达进行推理,因为其能够大规模地提供最佳性能和总体拥有成本[3] - OpenAI的发言人表示,该公司依靠英伟达为其绝大多数推理集群提供动力,并且英伟达在推理方面提供了最佳的性价比[3] OpenAI对英伟达硬件的具体不满与替代方案 - 七位消息人士称,OpenAI对英伟达硬件在ChatGPT上针对特定类型问题(例如软件开发和人工智能与其他软件通信)给出答案的速度并不满意[3] - 一位消息人士告诉路透社,OpenAI需要新的硬件,最终以满足其未来约10%的推理计算需求[3] - ChatGPT的开发商OpenAI曾与Cerebras和Groq等初创公司探讨合作,以提供用于更快推理的芯片[4] - 英伟达与Groq达成了一项价值200亿美元的授权协议,导致OpenAI与Groq的谈判破裂[4] - OpenAI自去年以来一直在寻找GPU的替代方案,重点关注那些将大量内存(称为SRAM)嵌入到芯片同一块硅片上的公司[7] - 将尽可能多的昂贵SRAM集成到每个芯片上,可以为聊天机器人和其他人工智能系统处理数百万用户的请求提供速度优势[7] - 推理比训练需要更多内存,因为芯片需要花费更多时间从内存中获取数据,而不是执行数学运算,英伟达和AMD的GPU技术依赖于外部内存,这会增加处理时间,降低用户与聊天机器人交互的速度[7] OpenAI在特定产品上的性能挑战 - 在OpenAI内部,硬件性能问题在其用于创建计算机代码的产品Codex上表现得尤为突出,该公司一直在大力推广该产品[8] - 一位消息人士称,OpenAI员工将Codex的部分缺陷归咎于英伟达基于GPU的硬件[8] - 首席执行官Sam Altman表示,使用OpenAI编码模型的客户将“非常重视编码工作的速度”[8] - Altman表示,OpenAI满足这一需求的一种方式是通过其最近与Cerebras达成的协议,并补充说,对于ChatGPT的普通用户来说,速度并不是那么重要[8] - 像Anthropic的Claude和Google的Gemini这样的竞争产品受益于更多地依赖Google内部制造的芯片(称为张量处理单元或TPU)的部署,这些芯片专为推理所需的计算而设计,并且与英伟达设计的GPU等通用AI芯片相比,可以提供性能优势[8] 英伟达的应对措施与行业整合 - 在OpenAI明确表达了对英伟达技术的保留意见后,英伟达曾与包括Cerebras和Groq在内的多家研发大量使用SRAM芯片的公司接洽,探讨潜在的收购事宜[10] - Cerebras拒绝了英伟达的收购提议,并与OpenAI达成了上个月宣布的商业协议[10] - Groq曾与OpenAI就提供计算能力进行谈判,并吸引了投资者的关注,计划以约140亿美元的估值为其注资[10] - 到了12月,英伟达采取了非独家全现金交易的方式,获得了Groq的技术授权,虽然这项交易允许其他公司获得Groq的技术授权,但由于英伟达挖走了Groq的芯片设计师,该公司目前正专注于销售云端软件[10] - 芯片行业高管表示,英伟达收购Groq核心人才的决定,似乎是为了巩固其技术组合,从而在快速变化的AI行业中更好地竞争[5] - 英伟达在一份声明中表示,Groq的知识产权与英伟达的产品路线图高度互补[5]
股价突跌2.89%!路透:OpenAI对英伟达最新一些AI芯片不满意,寻求替代方案!英伟达AI主导地位迎重大考验!
美股IPO· 2026-02-03 07:15
文章核心观点 - OpenAI对英伟达最新的部分AI芯片性能不满意,自去年以来一直在为AI推理环节寻找替代方案,这可能使两家公司的关系复杂化,并标志着对英伟达市场主导地位的一次重大考验 [1][3][4][13] OpenAI的战略转变与需求 - OpenAI战略转变源于对AI推理芯片的重视程度不断提高,推理正成为AI竞争的新战场 [3] - OpenAI对英伟达硬件在某些特定问题上的响应速度不满意,例如软件开发和AI与其他软件的交互 [6] - OpenAI需要新的硬件,未来最终可满足其约10%的推理计算需求 [6] - 在OpenAI内部,基于英伟达GPU的硬件被部分员工认为是其编程模型Codex性能不足的原因之一 [9] 英伟达的应对与市场动态 - 英伟达首席执行官黄仁勋否认与OpenAI关系紧张,并表示仍计划对OpenAI进行巨额投资,但规模可能不及此前报道的1000亿美元 [6][12] - 英伟达曾接洽Cerebras和Groq等专注于高SRAM芯片的公司探讨潜在收购,Cerebras拒绝了收购提议并与OpenAI达成商业合作 [11] - 英伟达以一项非独家的全现金交易获得了Groq技术的授权,协议价值200亿美元,此举被认为是为了巩固其技术组合 [7][12] - 英伟达在声明中强调,客户在推理领域仍选择英伟达,因其提供了最佳性能和总体拥有成本 [6] 技术差异与市场竞争 - 英伟达GPU在训练大型AI模型领域占据主导,但推理对内存需求更高,可能成为AI发展的新阶段 [3][9] - OpenAI在寻找替代方案时,重点关注在同一块硅片上集成大量内存(SRAM)的芯片,这可在处理海量用户请求时带来速度优势 [9] - 与依赖外部内存的英伟达和AMD GPU相比,谷歌自研的专为推理设计的TPU在性能上可能更具优势,并被Anthropic的Claude等竞争产品更多依赖 [10] 合作、谈判与投资进展 - 去年9月,英伟达曾计划向OpenAI投入高达1000亿美元以换取股份,并为OpenAI提供购买芯片的资金 [6] - OpenAI在此期间已与AMD等公司达成协议,采购竞争性GPU,但其不断调整的产品路线图使与英伟达的谈判变得复杂且进展缓慢 [6] - OpenAI曾讨论与Cerebras和Groq等初创公司合作以获得更快推理速度的芯片,但英伟达与Groq的授权协议终止了OpenAI与Groq的谈判 [7] - 媒体此前报道英伟达向OpenAI投资1000亿美元的谈判已经破裂,但黄仁勋后来澄清公司“绝对”会参与OpenAI当前融资轮 [12] 市场反应与行业影响 - 消息导致英伟达股价在周一收跌近2.9% [5] - 分析师认为该消息损害了市场对英伟达关键客户OpenAI的情绪 [14] - 这些发展突显了英伟达在AI芯片市场的主导地位可能因主要客户探索特定需求的替代方案而面临挑战 [13]