推理芯片
搜索文档
「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落关键一子
华夏时报· 2026-03-17 20:44
文章核心观点 - AI产业重心正从模型训练转向模型推理,英伟达通过推出Groq 3 LPU专用推理芯片及Vera Rubin平台,战略性布局并大举进攻推理芯片市场,以巩固其AI基础设施领导地位 [1][3][6] 产品发布与性能 - 英伟达在GTC 2026上正式推出Vera Rubin平台,该平台共搭载7款芯片,包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU [2] - Groq 3 LPU是一款专用的AI推理加速芯片,全称为“语言处理单元”,结合Rubin GPU,可将AI模型推理的吞吐量从每秒100个token提升至每秒1500个token甚至更多 [2] - 公司同时推出了专用于容纳Groq加速器的完整机架Groq LPX,旨在提升每个令牌上AI模型每一层的解码性能,以服务于需要处理数万亿参数模型和百万级token上下文窗口的多智能体系统 [2] 市场战略与布局 - 英伟达对推理市场的布局早有准备,于2025年12月以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU是收购后的首个公开成果 [3] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局,旨在用更精细化的产品回应市场变化和竞争挑战 [3] - 公司预测,到2027年底,其Blackwell和Rubin两条产品线的年收入将达到1万亿美元,这比半年前的预测翻了一倍 [1] 行业趋势与需求变化 - AI产业风向已变,智能体的普及推动市场需求从模型训练转向模型推理,因为智能体的核心场景更侧重于推理 [1][6] - 据高盛模型预测,在AI服务器的AI芯片中,非GPGPU芯片(如ASIC)的出货占比将从2024年的36%增长至2027年的45%,而GPGPU芯片的占比将从64%下降至55% [3] - 分析师指出,GPU在基座大模型训练、公有云等通用性要求高的场景更有竞争力,而ASIC在模型部署和推理场景下,因对能效比和延迟要求更高而更具优势 [3] 生态系统升级 - 英伟达的布局不仅是芯片,更是整个生态层面的升级,公司推出了Vera Rubin DSX AI工厂参考设计,指导如何设计、建设和运营整个AI工厂基础设施堆栈 [7] - 公司联合OpenClaw创始人等团队推出了NeMoClaw参考架构,内置安全技术,旨在让企业在私有环境中安全运行智能体系统 [6] - 黄仁勋表示,在AI时代,智能token是新的货币,而AI工厂是生成这些token的基础设施 [7] 竞争格局与行业影响 - 在ASIC推理芯片市场,英伟达已面临一批竞争对手,包括国外的Cerebras以及中国的寒武纪、华为、燧原科技等 [8] - 专家认为,英伟达进军推理芯片领域,对国内厂商而言既是挑战也是催化剂,将加速行业洗牌和技术升级 [8] - 短期内GPU凭借场景适应性和生态壁垒仍将主导市场(尤其在训练场景),长远看GPU与专用芯片将走向融合与市场分层 [8] 市场反馈与客户 - 英伟达应对推理需求的计划已带来回报,OpenAI上月已与英伟达达成协议,将采购具有“专用推理能力”的芯片 [4]
纽约时报:英伟达开创了AI时代,现在要“守江山”
凤凰网· 2026-03-17 08:35
文章核心观点 - 英伟达凭借GPU的先发优势在AI芯片市场建立了主导地位,但行业重心正从模型构建转向模型运行,公司在推理芯片领域面临来自谷歌、Cerebras等对手的竞争压力,正通过整合Groq技术等策略全力适应变化并守住其市场领导地位 [1][2][4] AI行业工作重心与竞争格局转变 - 过去一年,AI公司的工作重心发生转变,从使用英伟达芯片构建AI系统,转向更重视“推理”过程,即运行已训练好的AI模型以生成数据,这使得低成本、高速度的推理芯片变得更有价值 [2] - 在推理芯片的成本和速度方面,英伟达已落后于谷歌自研的张量处理单元以及Cerebras等新兴公司的专用芯片,这些竞争对手凭借在推理领域的优势,已从英伟达的长期客户如OpenAI和Meta那里赢得业务 [2] 英伟达的战略应对与新产品发布 - 为应对竞争并适应市场变化,英伟达在GTC开发者大会上发布了一款新产品,该产品整合了创业公司Groq的技术,将英伟达擅长接收AI请求的芯片与Groq能提升运行效率的芯片配对使用 [1] - 此次合作基于英伟达在2023年12月与Groq达成的一项价值200亿美元的授权协议,分析师认为整合双方技术旨在让推理过程更快、成本更低 [3] - 英伟达预计,从2025年到2027年,其Blackwell芯片和Rubin芯片的销售额至少能达到1万亿美元,这高于此前对2025年至2026年5000亿美元的预测,新产品将使用Rubin芯片 [4] - 公司还推出了NemoClaw,这是一款帮助软件公司使用智能体的产品 [4] 市场地位与未来挑战 - 英伟达的芯片目前占据了AI市场90%以上的份额,公司已成为美国经济的重要驱动力 [4] - 分析师预计,在用于开发AI的芯片领域,英伟达将保持90%的份额,但在用于运行AI的推理芯片领域,其份额可能仅占约三分之一 [6] - 英伟达能否赢得除OpenAI外的其他客户,将决定其在推理市场的份额 [6] - 与Groq的合作也有助于解决英伟达面临的制造瓶颈,因为Groq的芯片由三星电子生产,不依赖台积电,且其设计不需要目前供应紧张的高带宽存储芯片 [6]
英伟达(NVDA.US)GTC大会前瞻:AI霸主能否守住江山,市场紧盯“后训练时代”新战略
智通财经· 2026-03-13 20:31
文章核心观点 - 即将召开的英伟达GTC开发者大会是AI领域的年度风向标,其重要性在今年尤为突出,全球投资者关注公司如何应对日益激烈的市场竞争并巩固其AI芯片领导者地位 [1] - 大会是公司展示其在芯片、数据中心、软件平台CUDA、AI代理及机器人等领域最新进展的关键舞台,也是对将利润反哺AI生态战略成效的一次检验 [1] 行业竞争格局与焦点 - AI行业正从大模型的“训练”阶段加速向“推理”阶段过渡,市场竞争格局发生深刻变化 [1] - 尽管公司在训练和推理市场仍占据超过90%的份额,但分析师普遍认为其市场份额流失在所难免,尤其是在推理领域 [1] - 推理芯片初创公司认为,公司在训练领域将保持主导,但推理领域是另一回事,其核心软件CUDA在推理领域的“护城河”作用较弱 [2] - 包括OpenAI和Meta在内的核心大客户已启动自研芯片,Meta计划每半年发布一款全新AI芯片 [3] - 专用集成电路的崛起被视为对公司通用图形处理器的长期威胁,在推理场景展现出更高效率优势 [3] - 预计到2027年,随着企业自研ASIC芯片实现规模化落地,公司的市场份额将出现下滑,尤其是在推理芯片市场 [3] - 由英特尔和AMD长期主导的中央处理器在AI任务中的地位正在回升,随着代理式AI兴起,由CPU负责的“代理编排层”正成为新的性能瓶颈 [4] 公司战略与产品布局 - 公司预计将在GTC大会上推出专为推理工作负载优化的新产品,一款融合了去年12月以17亿美元收购的AI初创公司Groq技术的推理芯片有望亮相 [2] - 公司正通过收购(如Groq)和投资(如向光通信公司Lumentum和Coherent分别投资20亿美元)来加强防御并推动“共封装光学”技术的应用 [3] - CPO技术利用光信号在芯片间传输数据,有望大幅提升超大规模数据中心的连接效率并降低功耗,预计将是下一代Feynman芯片架构的核心突破方向 [3][4] - 公司很可能在GTC上将CPO技术定位为高效连接大规模AI集群的关键 [4] - 为回应CPU地位回升的新趋势,公司预计将展示仅使用其CPU的服务器产品 [4] - 公司首席执行官强调,智能体AI将成为推理需求的下一个重要驱动力 [6] - 随着语音、视频和多模态AI代理的潜力释放,AI代理领域有望带来新一轮的推理计算浪潮 [6] 增长驱动因素 - 机器人技术被视为重要的增长空间,公司上一季度已报告约60亿美元的机器人相关收入,并预测人形机器人的发展时间表将非常“激进” [6] - 物理AI可能比预期更快地成为现实 [6] 地缘政治与市场影响 - 地缘政治因素正日益成为影响公司未来的关键变量,美国考虑进一步扩大对AI芯片的出口限制,以及中国等关键市场的准入受限,正在重塑公司的全球销售版图 [7] - 在中国市场彻底遇冷后,公司已停止生产H200芯片,并将产能转移至下一代Rubin平台 [7] - 中东地区如沙特和阿联酋等国的大规模AI基础设施投资,对公司而言意义重大,但地区冲突、能源成本及数据中心建设速度等因素为这些新兴市场的需求增添了不确定性 [7]
英伟达“龙虾”乐园即将开张
36氪· 2026-03-13 19:43
年度GTC大会概况 - 英伟达将于下周举行年度GTC大会,预计有来自全球**190多个国家和地区**的**3万余人**现场参会 [6] - 大会期间,GTC公园将全程举行“搭建龙虾”活动,与会者可在现场部署一个始终在线的AI助手 [1] - 公司鼓励与会者携带英伟达芯片驱动的设备参加,现场将提供硬件购买,并可将“龙虾”AI助手部署在云端 [4] 硬件产品与技术创新 - 公司掌门人黄仁勋的主题演讲是资本市场关注的重中之重 [8] - 硬件关注焦点包括:算力芯片路线图、潜在的推理芯片以及自研光通信产品 [8] - 美银证券分析师指出重点关注方向:延伸至费曼架构的最新产品路线图、一系列全新的协同设计且模块化拆分的产品(如CPX、LPU)、用于大规模扩展系统的自研光互连技术(如集成CPO的交换机) [8] - 分析师展望公司可能讨论**102.4T Spectrum-6交换机**(可与Rubin平台配套使用)以及**115T Quantum-X交换机**(采用共封装光学CPO技术) [8] - 公司可能与英特尔联合发布一款定制化x86 CPU,以扩大其在企业数据中心乃至消费级CPU市场的采用范围 [8] - 现场可购买的硬件包括个人超算DGX Spark,其售价达**4699美元**(约合人民币**3.2万元**) [4][6] 推理芯片与战略合作 - 市场猜测黄仁勋预告的“前所未见芯片”可能是与推理芯片公司Groq合作发布的**LPU** [9] - 推理被视为大规模推广AI应用的最后瓶颈之一,该芯片的发布意味着公司将正式应对谷歌、微软等公司的定制芯片竞争 [9] - 公司于去年底支付了**200亿美元**获得Groq的专利许可,同时Groq创始人、总裁及核心团队已加入公司,双方关系引发广泛关注 [9] 软件与AI平台 - 公司可能发布一个面向企业AI代理的开源平台,名为**NemoClaw**,旨在为企业提供结构化方式来构建和部署能自主执行多步骤任务的AI智能体 [12] - 公司本周发布了迄今为止最强大的开源权重AI模型**Nemotron 3 Super**,专为大规模运行复杂智能体系统设计 [16] 产业愿景与开放模型 - 黄仁勋将举行以“开放模型的现状与未来”为主题的圆桌谈话,邀请包括Cursor、Perplexity、OpenEvidence等AI新锐公司及前OpenAI CTO Mira Murati等行业领袖参与 [13] - 公司认为,过去一年AI领域最重要的变化之一是开放前沿模型的快速进展,开放式创新正在加速各行业进步 [16] - 据媒体挖掘,公司未来五年将累计投入**260亿美元**布局开源AI大模型研发,该规模是OpenAI训练GPT-4成本的**8倍有余** [16] 市场影响与预期 - 分析师不指望公司会正式给出未来两年的销售数据指引,但有关**Rubin架构**量产爬坡的消息可能对横盘多时的股价形成提振作用 [10] - 鉴于参会者中有不少专业开发者,今年的GTC大会不仅可能成为“龙虾大会”,甚至可能成为一场“斗虾大会” [6]
英伟达拟发布“神秘芯片” 或是专为推理设计的新架构
21世纪经济报道· 2026-03-11 13:47
行业趋势:AI算力需求重心转向推理 - 全球算力需求结构正发生明显变化,市场重心从训练转向推理 [3] - 据德勤预测,到2026年,“推理”将占据全部AI计算能力的三分之二 [3] - 未来将出现价值数十亿美元的推理专用优化芯片,部署在数据中心和企业服务器中 [3] 公司动态:英伟达GTC大会预期与产品战略 - 英伟达计划在3月中旬的GTC大会上推出一款“世界前所未见”的全新芯片 [1] - 业界推测最大亮点之一是英伟达将正式揭晓Rubin及下一代Feynman架构GPU的核心技术细节 [3] - 英伟达极有可能会推出整合了Groq LPU技术的全新推理芯片 [3] - 这将是英伟达首次在核心AI算力产品线中大规模引入外部架构 [4] - 此前英伟达推出Rubin CPX针对Prefill降本需求,本次或将推出LPU或“类LPU”芯片来实现Decode提效 [5] 技术分析:推理芯片架构创新与挑战 - 在基于GPU的推理架构中,计算核心与HBM之间频繁的数据搬运会影响模型decode阶段的时效性 [6] - Groq LPU采用离计算核心更近的SRAM存储模型参数,例如230MB片上SRAM可提供高达80TB/s的内存带宽,数据处理速度远超GPU架构 [6] - 面对千亿、万亿参数的大模型,纯SRAM方案在容量上无法胜任,完全替代HBM不可行 [6][7] - 英伟达可能采用类似AMD 3D V-Cache的技术,通过台积电的SoIC混合键合技术,将包含大量SRAM的LPU单元直接3D堆叠在GPU核心晶圆上 [7] - 3D堆叠SRAM方案可通过垂直堆叠提升密度,规避传统SRAM容量受面积密度限制的问题 [9] - 未来的GPU与NPU都有可能采用3D堆叠SRAM的方式,实现访存带宽的飞跃,同时保持原有的软件生态 [9] - 复杂的AI芯片可能同时需要两者:先用SoIC堆叠LPU和GPU核心,再通过CoWoS与HBM封装在一起 [9] 产业链影响:技术路径对供应链的潜在重塑 - AMD等头部厂商已有3D堆叠布局,如2021年公布的3D V-Cache技术可垂直堆叠SRAM缓存 [8] - 富士通旗下MONAKA处理器也采用3D SRAM技术,计划2027年出货 [8] - SRAM 3D堆叠技术(如台积电SoIC)需要在晶圆制造阶段进行晶圆对晶圆键合,技术和工艺与前端制造深度耦合,这将进一步将价值从后道封装前移 [9] - 为了在垂直堆叠中获得最高的互联密度和能效,最底层的计算晶圆必须采用最先进的工艺(如A16),加剧了行业对尖端工艺的依赖 [10] - 如果高端芯片价值不断向前道制造和先进封装集中,本土封测厂可能面临被“挤出”高端市场的风险,但也带来了差异化竞争机遇 [10]
周鸿祎,最新发声!
中国基金报· 2026-02-27 15:29
AI赋能网络安全 - 全国政协委员、三六零创始人周鸿祎建议关注AI智能体在安全领域的应用 以Anthropic为例 AI编程和AI查找漏洞能解决许多传统安全难题 [2] - 三六零公司已开发几十种、上万个AI安全智能体 这些智能体能够挖掘软件漏洞并抵御来自其他国家的黑客智能体 [2] AI算力发展路径 - 将算力区分为训练算力和推理算力至关重要 训练算力在规模上仍有发展空间 而推理算力的发展空间是无限的 [2] - 建议各地在发展算力时应偏向推理算力 从国家产业政策看 芯片政策不能只追求英伟达的高端训练芯片 推理芯片也具有重要战略价值 [2] AI在企业端的落地与应用 - 除了云服务 许多中国企业需要进行私有化部署 其大模型和智能体应部署在企业内部 算力需本地化 [2] - 企业难以负担全部购买昂贵的B200芯片 廉价的推理芯片将为企业私有化部署提供很大便利 推理芯片的目标并非做出比英伟达芯片更便宜或更低端的产品 [2] - 智能体需做得更加专业 能够直接为企业带来价值 企业才愿意付费使用 [3] AI在个人端的普及与使用 - 当前AI使用面临的问题是用户主要将其作为AI助手或搜索工具 个人如何打造专属私人智能体成为关键 [3] - 从OpenClaw获得的启示是 实现路径需要简单化 [3]
微软投资AI芯片公司,挑战英伟达
半导体行业观察· 2026-02-14 09:37
文章核心观点 - 人工智能芯片行业正从以训练为中心转向以推理为中心,推理阶段的效率、成本和延迟成为新的竞争焦点 [2][3] - 以d-Matrix为代表的初创公司正通过设计专用推理芯片,挑战英伟达在AI芯片市场的统治地位,其核心优势在于通过架构创新实现更低的延迟和更高的能效 [2][5][7] 行业趋势:从训练到推理的转变 - 人工智能工作负载的重心正从模型训练转向模型推理,推理关乎效率,而训练关乎表现 [2][3] - 推理不仅是一个计算问题,更是一个计算与内存的综合问题,内存访问速度是影响延迟的关键因素 [3][4] - 当前大部分基础设施针对训练优化,优先峰值性能,而推理(尤其是交互式AI)更看重平均响应速度和低延迟 [4] d-Matrix的技术与产品策略 - 公司核心理念是制造能提供更快、更便宜、更高效率推理的芯片,旨在改变AI竞争格局 [2] - 其解决方案的核心架构创新在于将计算和内存紧密融合,缩短数据移动距离,并采用模块化的芯片组设计,以优化推理数据流、降低延迟并提高每瓦每秒令牌数 [5] - 公司声称其芯片在运行推理操作时,成本比GPU降低约90%,且能效(每瓦浮点运算次数)显著更高 [5] - 公司已开始小批量出货(几百颗),预计很快达到数千颗,并计划在今年实现数百万颗的大规模量产 [6] 市场竞争格局与挑战者涌现 - 英伟达目前是AI芯片市场无可争议的冠军,市值达4.5万亿美元,其GPU主导训练和推理市场 [7] - 但市场对替代方案的兴趣日益增长,客户开始寻求对冲或获取更多芯片的途径,投资者和初创公司尤其看到了推理领域的市场机会 [7][8] - 近期行业出现多笔重大交易与融资,显示竞争加剧:Groq被收购(交易额据报达200亿美元)、Cerebras与OpenAI签署价值100亿美元的芯片供应协议、Anthropic签署非英伟达芯片协议、Etched融资约5亿美元、d-Matrix于去年11月融资2.75亿美元 [8][9] - 中国开源推理模型DeepSeek的出现也助推了市场对快速推理芯片的兴趣 [9] - 尽管英伟达实力强大并承诺每年更新芯片,但行业开始出现裂痕,专用推理硬件被视为行业发展到一定阶段的必然产物 [10] 其他主要参与者的动态 - OpenAI已开始使用Cerebras的巨型芯片运行其GPT-5.3-Codex-Spark编码模型的推理,据报道速度比其他架构提升15到20倍 [5] - 大型科技公司也在开发自有芯片:微软发布了第二代AI芯片Maia,并支持d-Matrix;亚马逊和谷歌也拥有自研芯片(如Trainium、TPU),但它们仍大量使用英伟达GPU [9][10] - 行业观点认为,未来市场可能不会只有一个赢家,专用硬件将随着AI应用的工程化发展而兴起 [7][10]
AI需求仍强却带不动股价!英伟达四季度至今仅涨1%,市场观望情绪转浓
华尔街见闻· 2026-02-13 22:23
文章核心观点 - AI芯片行业竞争格局正在演变,英伟达的垄断地位面临挑战,市场正从“押注单一龙头”转向“重新定价竞争风险”[3] - 尽管英伟达仍是市场领导者且地位稳固,但其估值溢价正被市场重新评估,股价表现趋于冷却[1][6] 竞争格局演变 - 英伟达首席执行官黄仁勋以约200亿美元收购推理硬件初创公司Groq的技术授权并招募其大部分芯片团队,印证了其他公司在特定领域的竞争力[3] - Cerebras与OpenAI签署了100亿美元的快速推理芯片供应协议,Anthropic也与多家非英伟达芯片供应商达成合作[3] - 自Groq交易以来,市场对AI芯片格局的认知被重塑,潜在投资者对初创企业的兴趣明显上升,例如SambaNova放弃了低价出售计划转而寻求新一轮融资[3] 推理芯片市场成为焦点 - 推理芯片市场被视为挑战英伟达主导地位的突破口,越来越多的初创企业和投资者正将目光投向该领域[4] - 交易公司Jump共同领投了推理芯片初创公司Positron的2.3亿美元融资,并已成为其客户[4] - 初创企业正试图通过探索不同类型的内存架构,在推理场景下实现比英伟达更快的响应速度[4] - 自去年初DeepSeek亮相以来,市场对快速推理芯片的兴趣显著升温,例如D-Matrix公司已于去年11月完成2.75亿美元融资[4] 科技巨头与初创企业布局 - 大型科技公司正竞相开发自有AI芯片以减少对英伟达的依赖,例如OpenAI发布运行在Cerebras芯片上的模型,微软推出第二代自研AI芯片Maia[6] - 初创企业亦积极布局,推理芯片公司Etched上月融资约5亿美元,AI模型初创公司Simile获1亿美元融资[6] - 尽管巨头加速自研,亚马逊、谷歌、微软、OpenAI等仍大量采购英伟达GPU,英伟达作为市场领导者的地位依然稳固[6] 英伟达的应对与市场动态 - 英伟达拥有多种产品线并承诺每年对芯片进行一次完整的重新设计,与Groq的交易为其提供了进一步扩张的机会[7] - 英伟达首席执行官黄仁勋未承诺推出专门用于推理的新芯片,但表示“也许在某个地方我们可能会创造一些独特的东西”[7] - 市场预计英伟达将在3月的旗舰会议上宣布措施以应对快速推理芯片的需求[7] - 尽管历史上挑战者大多未能成功与英伟达大规模竞争,但市场正开始出现裂痕,行业增长将催生专用硬件[7]
旋极信息:公司目前未在脑机方面进行布局
证券日报网· 2026-01-29 09:52
公司业务布局澄清 - 公司明确表示目前未在脑机接口方面进行业务布局 [1] 公司核心技术能力 - 公司在推理芯片及算力中心领域具备投资、建设、运营的技术能力 [1]
旋极信息(300324.SZ):目前未在脑机方面进行布局
格隆汇· 2026-01-28 21:39
公司业务布局澄清 - 公司明确表示目前未在脑机接口领域进行业务布局 [1] 公司核心技术能力 - 公司在推理芯片领域具备投资、建设和运营的技术能力 [1] - 公司在算力中心领域具备投资、建设和运营的技术能力 [1]