Workflow
NPU
icon
搜索文档
2025年中国AI推理芯片行业政策、产业链、发展现状及发展趋势研判:产业链加速重构,竞争格局将形成"一超三强"的竞争态势[图]
产业信息网· 2025-12-18 09:43
内容概要:AI推理芯片是一种专门用于加速人工智能模型推理(即使用预训练模型进行数据处理和预 测)的高性能计算芯片。与用于模型训练的芯片不同,AI推理芯片更注重能效比、低延迟和高吞吐 量,以满足实时应用需求。在AI大模型产业化加速的当下,算力需求正从训练阶段向推理阶段倾斜。 当前AI算力需求的结构性转变,为中国芯片企业提供了重要战略机遇。随着开源大模型的成熟与普 及,AI模型预训练环节已形成相对稳定的市场格局,而终端应用落地催生的推理算力需求,AI推理芯 片行业正进入爆发式增长阶段。中国市场作为全球最大的人工智能场景市场和需求市场,一直保持着对 先进AI芯片大量需求。国家也不断出台有利于促进AI芯片行业发展的政策,AI推理芯片行业前景广 阔。2024年我国AI推理芯片相关产品及服务市场规模增长至1626亿元,其中,GPU占81.6%,NPU占 16%;预计2025年我国AI推理芯片相关产品及服务市场规模增长至3106亿元,其中,GPU占78.40%, NPU占19.30%。 上市企业:海光信息[688041]、商汤-W[00020]、旷视科技(A04701]、依图科技(A20550]、寒武纪 [688256]、 ...
NPU,大有可为
半导体芯闻· 2025-12-15 18:17
如果您希望可以时常见面,欢迎标星收藏哦~ PC OEM和芯片供应商正指望消费者对人工智能(AI)的兴趣来推动PC出货量增长,这种增长在几 年来从未见过。近年来,人工智能的兴起促使一种专门为加速人工智能任务而设计的新型专用计 算硬件的出现:神经处理单元 (NPU)。与其更成熟的前身GPU一样,NPU提供了一个专门优化的 专用硬件平台,可以高效执行某些类型的计算。 为了支持人工智能PC,处理器供应商一直在其异构PC处理器中添加集成的NPU。Intel、AMD 和高通都推出了符合微软要求的产品,即集成的NPU提供每秒至少40万亿次运算(TOPS),以支 持Copilot+ AI助手。人工智能PC和集成的NPU仍处于早期阶段;机器学习工作负载(如图像分 类和对象检测)以及深度学习活动(如计算机视觉和自然语言处理)正在以大致相等的比例利用 NPU、GPU和CPU。但这种相对平衡将迅速改变。随着进一步的创新,以及软件开发人员对它们 的熟悉程度越来越高,MPR预计NPU将在AI PC中承担大部分 AI 工作负载。 一条人人都走的路 当然,CPU早在20世纪50年代和60年代就已出现,当时正值计算机时代的黎明。它们从执行(相 ...
上市AI芯片公司落地数个千卡集群;国内有万卡经验的公司不超过3个;拆机DDR4半公开售卖;智算中心建设遇到「死结」
雷峰网· 2025-12-09 18:55
行业活动与会议 - 第八届GAIR全球人工智能与机器人大会将于2025年12月12-13日在深圳举办,聚焦大模型、算力变革、世界模型等议题 [1][20][22] - 大会将开设智算论坛,汇聚AI芯片、智算中心、云计算、基础设施与资本领域的参与者,探讨算力革命的趋势 [1] - 大会将汇集超过50位院士/顶会主席/行业领袖、300多位AI学术青年及1000多位行业精英 [22] 国产AI芯片发展动态 - 一家科创板上市的AI芯片公司严格把控服务器生产质量,已落地数个千卡级别集群项目 [2] - 该公司新一代旗舰产品单卡算力约0.5P,包含全模块的价格为25万元,上一代8卡一体机售价在60-65万元 [2] - 一家头部AI芯片公司近期订单强劲,获得华北某互联网大厂20万片芯片采购订单,专项用于搜索与推荐业务 [3][4] - 该头部芯片公司CEO向华南某互联网大厂承诺“不限量供应”,以巩固头部客户合作 [4] - 某芯片厂商推行严格的“原厂授权销售”机制,下游客户准入需经原厂直接审核 [14] - 近期华东某城市新建的多个算力项目均采用该厂商芯片,且芯片采购方大多与该厂商有关联 [14] 国产算力生态与替代挑战 - 国内头部互联网企业正加速推进国产算力替代,以构建自主可控的算力供应体系 [5] - 大厂普遍采用“场景适配先行、逐步迭代优化”的路径,优先筛选国产芯片能满足需求的业务场景进行适配 [5] - 国产芯片替代面临算子深度定制、模型量化优化、软硬件适配调试、CUDA生态迁移等多重挑战 [5] - 某大厂已成立针对国产算力业务的新部门,以推动替代进度 [5] - 国内正在探索共建中国版CUDA,例如智源研究院牵头的众智FlagOS和北京大学的TileLang [6] - 华为、清微智能、天数智芯、沐曦、算能等公司已加入FlagOS生态,但各家投入资源差异极大,有的仅数人,有的近百人 [6] 智算中心行业现状与瓶颈 - 智算中心项目成功率大幅下降,以前接触10个项目能成5个,现在可能不到1个 [10] - 行业逻辑生变,政府投入减少,参与方不愿承担风险,开始算细账并要求合同及保证金,导致项目推进陷入死循环 [10] - 国内真正具备万卡级集群实际部署与运维经验的算力企业不超过三家,绝大多数厂商仍停留在千卡集群建设阶段 [11][12] - 大规模训练场景中,卡间互联是制约整体效率提升的关键瓶颈 [11] - 英伟达Rubin架构通过新一代NVLink 6交换机芯片、X1600 IB/Ethernet Switch和CPO技术优化大集群内卡间互联 [12] - 政府投入减少后,金融租赁公司成为智算中心项目出资方,但资金成本(毛利加利息)可能高达15%,相比政府投资时大幅提高 [13] - 资金高成本导致出现“项目缺资金,资金缺项目”的死结,除非能找到利率低至2%的资金 [13] 存储芯片市场波动 - 存储芯片价格飙升对部分国内科技企业出海业务造成显著冲击,涨幅已超出某些行业产业链各方承受能力 [7][8] - 某智能模块供应商因存储成本上涨导致产品提价,海外订单明显收缩,国外客户转向观望 [8] - 存储芯片价格持续高位运行,已有厂商开始采用拆解旧设备的“机料”进行生产或转售,现象从“地下”蔓延至半公开状态 [9] - 当前DDR4产能极度稀缺,市场上全新芯片寥寥无几,拆机DDR4成为替代来源,经测试后根据成色定价,与全新芯片价差最多几百元 [9] 新兴趋势与市场拓展 - 生成式AI从云端走向端侧,带火了NPU创业和人才需求 [15] - 拥有苹果背景的上海烨知心、华为老兵创立的智辰科技等端侧NPU初创公司受到资本追捧 [15] - 智能硬件龙头公司及自研芯片的自动驾驶公司也在积极招募NPU人才 [15] - 国内头部AIDC(人工智能数据中心)厂商正加速海外算力市场布局,计划在东南亚地区建设万卡级大规模B200算力集群 [16][17] - 该出海项目规模庞大,已吸引供应链上下游众多厂商关注并寻求合作 [17]
手机AI愈发重要,可为何厂商不再宣传NPU算力
36氪· 2025-12-01 10:42
行业现象:NPU算力宣传策略转变 - AI成为智能手机行业核心宣传点,各品牌均强调自研AI大模型及端侧AI功能 [1] - 上游芯片厂商在新款SoC发布时重点介绍NPU架构改进及能效提升,并与AI大模型进行端侧优化演示 [3] - 与早期明确公布NPU算力指标的做法不同,当前厂商普遍转向功能演示,回避公布具体算力数字 [5][6][8] 厂商案例:高通NPU算力演进 - 高通自2019年骁龙855起公布NPU算力,从7TOPs逐步提升至骁龙8 Gen1的52TOPs [8] - 骁龙8 Gen1之后高通停止公布算力数字,公开资料显示骁龙8至尊版NPU算力为80TOPs,第五代骁龙8至尊版为100TOPs [10] - 尽管高通NPU性能在行业中保持领先,但其算力进步速度从骁龙8 Gen2到Gen3可能已放缓 [10] 竞争格局:主流芯片NPU算力对比 - 根据统计数据,高通骁龙8 Elite领先版NPU算力为80TOPs,显著领先于三星Exynos 2500的59TOPs、联发科天现9400+的50TOPs及小米玄戒01的44TOPs [11] - 在高通带头不再公开宣传NPU算力后,其他芯片厂商也跟随此策略 [11] 技术演变:NPU设计需求变化 - 早期NPU设计专注于计算视觉任务,追求峰值算力以实现快速计算,对能效比要求较低 [18] - 当前AI功能扩展至内容生成领域,NPU需针对生成式AI任务调整架构,并更加注重长时间运行的能效比 [20] - NPU应用场景增多,如协助GPU进行游戏超帧超分处理,要求其摆脱爆发式性能设计思路 [20] 未来趋势:NPU性能提升路径 - NPU硬件性能近年重回增长轨道,但受制程成本及功耗分配限制,难以维持代代翻倍的进步速度 [12][15][21] - 性能提升方式转变,部分厂商通过将私有算法固化进NPU,以定制硬件方式提升特定任务计算效率 [23] - 软件优化重要性凸显,厂商通过与AI大模型技术合作及深度调校,提升NPU实际执行速度,效果可能超越单纯硬件设计 [25]
ASIC终于崛起?
半导体行业观察· 2025-11-28 09:22
英伟达市场地位分析 - GPU被定义为人工智能时代的核心产品,如同个人电脑时代的Windows操作系统 [1] - 英伟达在基于GPU的人工智能芯片市场占据90%份额,其GPU单价高达3万至4万美元 [1] - 公司凭借GPU产品成为全球市值最高的企业 [1] 竞争格局变化 - 各大科技巨头开始自主研发专用集成电路或拓展半导体供应商,英伟达统治地位出现动摇迹象 [1] - 人工智能开发模式从训练转向推理,更适合使用能效更高的专用芯片,这正在动摇英伟达的垄断地位 [1] - ASIC专为特定用途设计,在能效和成本方面优于英伟达的GPU [1] 科技公司自研芯片进展 - 谷歌定制芯片TPU性能优于GPU且功耗更低,人工智能初创公司Anthropic计划使用多达100万个TPU开发模型 [3] - Meta已将谷歌TPU引入数据中心,并开发出自有AI芯片MTIA用于AI开发和服务 [3] - OpenAI计划与博通合作于明年年底生产自研芯片,亚马逊AWS运营着配备50万颗Trainium2芯片的AI数据中心 [3] - 阿里巴巴和百度等中国公司使用自主研发半导体训练AI模型,旨在减少对英伟达依赖 [3] 技术经济性比较 - 安装24000块英伟达最新Blackwell GPU需8.52亿美元,而同等规模谷歌TPU成本仅为9900万美元 [5] - 定制芯片比GPU更便宜节能,在运营方面更具优势,有望缓解人工智能基础设施过度投资引发的泡沫担忧 [5] - 推理阶段所需性能水平远不及训练阶段,TPU和NPU等高能效轻量化半导体器件受到更多关注 [5] 半导体技术特性对比 - CPU被比喻为技艺精湛的大厨能处理各种任务但耗时较长,GPU相当于1000名兼职工人同时高效运转 [8] - TPU是专门执行特定任务的机器,不需要像GPU那样多的兼职工人但仍需大型工厂运行 [8] - NPU模拟人脑结构,体积小重量轻功耗低,非常适合智能手机和家用电器应用 [8] 产业链格局演变 - 随着大型科技公司与芯片设计公司合作生产自有芯片,博通等芯片设计公司正崛起成为新竞争对手 [6] - 以英伟达为中心的AI生态系统预计将发生变化,目前台积电代工英伟达芯片的格局已十分稳固 [6]
他们都想摆脱英伟达
半导体行业观察· 2025-11-22 11:09
文章核心观点 - 英伟达凭借GPU在人工智能市场占据主导地位,但定制ASIC、FPGA和边缘AI芯片等替代方案正迅速崛起,形成多元化竞争格局[3][6][17][19] 用于通用计算的GPU - GPU从游戏转向AI工作负载,使英伟达成为全球市值最高上市公司,过去一年出货约600万块最新Blackwell GPU[4] - GPU并行计算特性适合AI训练和推理,英伟达GPU深度集成CUDA软件平台,AMD使用开源软件生态系统[7][8] - 装有72个Blackwell GPU的服务器机架售价约300万美元,每周出货量约1000个[9] - 英伟达向云服务商、AI公司及外国政府销售GPU,例如向OpenAI出售至少400万块GPU[8] 用于定制云AI的专用集成电路 - 大型云服务商设计定制ASIC以降低对英伟达GPU依赖,定制ASIC未来几年增速可能超过GPU市场[3][6] - 谷歌2015年推出首款AI定制ASIC TPU,2025年发布第七代Ironwood TPU,Anthropic将使用多达100万个TPU训练Claude模型[11][12] - 亚马逊AWS推出Inferentia和Trainium芯片,其ASIC性价比比其他硬件供应商芯片高出30%到40%[12][13] - 定制ASIC设计成本高,企业依赖博通等芯片设计公司提供技术支持,博通帮助谷歌、Meta和OpenAI构建ASIC[15] - 微软部署自研Maia 100芯片,其他参与者包括高通、英特尔、特斯拉及Cerebras等初创公司[16] 基于NPU和FPGA的边缘AI - 边缘AI芯片集成于设备系统芯片,支持低延迟、数据隐私和节能,应用覆盖手机、汽车、机器人等领域[17][18] - 高通、英特尔、AMD生产NPU,苹果M系列芯片包含神经网络引擎,三星手机配备自研NPU[18] - FPGA可通过软件重新配置但AI性能较低,AMD以490亿美元收购Xilinx成为最大FPGA制造商,英特尔以167亿美元收购Altera位居第二[19] 行业生态与竞争格局 - 台积电为所有AI芯片公司生产芯片,其亚利桑那州工厂已投产英伟达Blackwell GPU[19] - 尽管竞争加剧,英伟达凭借软件生态和多年技术积累仍难以被撼动[19]
AI日报丨AI投资加剧投资者担忧,甲骨文债券遭抛售,谷歌加码得州布局,计划投资400亿美元建数据中心
美股研究社· 2025-11-17 20:21
AI投资与市场动态 - 甲骨文计划增加380亿美元债务以投资AI基础设施,导致其债券价格下跌,2033年到期票面利率4.9%的债券收益率在过去两周上涨超过三个基点,2032年到期票面利率4.8%的债券收益率一周内上涨近两个基点 [5] - 易点天下与阿里云达成AI漫剧出海框架合作协议,共同打造全链路垂直解决方案,覆盖从算力支持到营销变现的完整商业闭环 [7][8] - 华为将于11月21日发布突破性AI技术,通过软件创新将GPU、NPU等算力资源利用率从行业平均30%-40%提升至70%,并实现英伟达、昇腾及其他三方算力的统一管理 [9] 6G与通信技术进展 - 小米"端到端AI无线技术原型验证系统"入选北京6G实验室十大进展,该系统支持基于AI的控制与业务数据传输,未来公司将持续加大6G关键技术研究和标准化投入 [6] 科技巨头战略与人事变动 - 苹果CEO蒂姆·库克最早可能于明年卸任,硬件工程高级副总裁John Ternus被视为潜在接班人,其曾参与苹果主要硬件产品设计并多次主导发布会 [11] - 伯克希尔第三季度13F报告显示巴菲特减持苹果股票并增持谷歌母公司Alphabet股份,此为巴菲特退休前最后一份持仓报告 [12] - 谷歌计划在得州投资400亿美元新建三座数据中心,投资持续至2027年,预计创造数千岗位并配套建设太阳能与储能设施 [13][14] 供应链与合作协议 - 特斯拉与澳大利亚Syrah公司延长石墨供应协议解决期限至2026年1月16日,原合同规定4年内供应8000吨石墨阳极材料 [15]
爆拉!板块出现涨停潮!锂矿双雄齐齐飙升,千亿巨头触及涨停!行业周期反转了吗?
雪球· 2025-11-17 16:10
市场整体表现 - 三大指数弱势震荡,上证指数跌0.46%,深证成指跌0.11%,创业板指跌0.20%,北证50涨0.81% [2] - 沪深京三市全天成交额19303亿元,较上日缩量501亿元,全市场超2500只个股上涨 [2] - 盘面维持快速轮动态势,银行板块回调,海峡两岸概念高热不退,锂矿股全线爆发 [3] 锂矿板块 - 碳酸锂主力期货合约涨停,带动A股锂矿板块集体大涨,天齐锂业逼近涨停,赣锋锂业涨7.48% [5] - 供给端呈现国内增产、进口收缩特征,9月碳酸锂进口量19596.9吨,环比减少10.3%,出口量150.816吨,环比锐减59.12% [7] - 10月国内碳酸锂产量51530吨,环比增加9.31%,但开工率43%,环比下降5个百分点,显示国内产能释放仍受制约 [7] - 需求层面旺季效应显著,10月国内动力电池装车量84.1GWh,环比增10.7%、同比增42.1% [8] - 市场多空分歧较大,需关注江西锂矿项目复产时间及动力端消费淡季影响 [8] 华为算力概念 - 华为概念表现活跃,东方国信涨近13%,拓维信息涨超6% [10] - 华为将于11月21日发布一项AI领域突破性技术,有望将算力资源平均利用率从30%-40%提升至70% [12] - 该技术核心在于通过软件创新实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用 [12] - 以中科曙光、华为为代表的科技巨头正积极布局超节点技术,有望突破我国单芯片制程受限的局面 [12] 贵金属板块 - 金银期货价格大幅下挫,沪银跌超4%,沪金跌超3%,A股贵金属板块领跌两市 [14] - 招金黄金跌3.54%,湖南白银跌3.48%,赤峰黄金跌2.16%,西部黄金跌2.41% [15] - 多位美联储成员释放暂不急于降息信号,市场对12月降息概率预期从超过50%下降至不足一半 [16] - 尽管短期回调明显,但机构对黄金长期走势仍保持乐观,认为美元持续走弱、普遍降息预期及滞胀风险可能支撑黄金投资需求 [16]
智能早报丨“羊毛党”用AI骗取“仅退款”;华为将发布AI领域突破性技术
观察者网· 2025-11-17 10:02
苹果公司管理层潜在变动 - 蒂姆·库克最早可能于明年卸任苹果首席执行官,其任职已长达14年 [1] - 苹果硬件工程高级副总裁John Ternus被视为最可能接班人,其于2001年加入公司,深度参与所有主要硬件产品工程设计 [1] - 苹果习惯在1月底财报后公布重大人事变动,若明年初宣布新CEO,可为6月WWDC和9月iPhone发布会前的管理层磨合留出时间 [1] 电商行业新型欺诈风险 - 部分消费者利用AI工具伪造商品瑕疵图片以骗取“仅退款”,百元内商品是重灾区 [1] - AI生成的图片仿真度极高,难以辨识,仅需输入简单指令即可快速生成 [1][2] - 围绕“仅退款”已衍生灰色产业,支付288元学费可学习相关技术,一个账号约可成功退款30次,有案例显示累计获利达2000元 [2] 存储芯片市场动态 - 因上游存储芯片价格疯涨,小米、OPPO、vivo等多家手机厂商已暂缓本季度采购,库存普遍低于两个月,部分厂商DRAM库存低于三周 [2] - 存储芯片原厂(美光、三星、SK海力士)报价涨幅接近50%,并表示若不接受报价可将产能转向服务器客户 [2] - AI大模型浪潮推动数据中心对存储芯片需求激增,同款产品给服务器厂家的报价往往高出手机厂商30%以上 [2] 华为AI技术突破 - 华为将于11月21日发布AI领域突破性技术,旨在将GPU、NPU等算力资源利用率从行业平均的30%-40%提升至70% [3] - 该技术通过软件创新实现英伟达、昇腾及其他三方算力的统一资源管理与利用,屏蔽硬件差异 [3] - 技术路线与以色列AI初创公司Run:ai有共同性,后者于2024年底被英伟达以7亿美元收购 [3][4] AI基础研究与前沿探索 - 北京大学团队推出AI-Newton系统,在无监督、无物理先验知识前提下,成功重新发现牛顿第二定律、能量守恒定律等基础规律 [5] - 该系统在测试中平均识别出约90个物理概念和50条一般定律,展现出渐进性和多样性,为AI驱动自主科学发现提供新范式 [5] - OpenAI发布可解释性新研究,提出训练稀疏模型使内部机制更易理解,通过找出“最小回路”量化可解释性,但研究仍处早期阶段 [6]
文化和旅游部提醒:中国游客近期避免前往日本;苹果公司CEO库克被曝可能于明年卸任
第一财经资讯· 2025-11-17 09:32
全球主要股指表现 - 美股上周表现分化,道指周涨0.34%,标普500指数周涨0.08%,纳指周跌0.45% [1] - 欧洲三大股指全线上涨,法国CAC 40指数周涨2.77%,德国DAX 30指数周涨1.30%,英国富时100指数周涨0.16% [1] 美国经济数据与货币政策 - 美国联邦政府结束停摆,关键经济数据发布将恢复正常,9月就业报告可能成为首个发布的数据 [2] - 市场对美联储12月降息预期存疑,货币市场对"降息"与"维持利率不变"的概率定价基本持平 [2] - 美联储10月会议纪要将于19日发布,多位美联储官员暗示下月利率可能维持不变 [2] - 纽约联储与费城联储的制造业调查数据将分别于17日和20日公布 [3] - 11月标普全球PMI初值和密歇根大学消费者调查将于21日发布,对填补经济数据空白有关键意义 [3] 欧美经济数据焦点 - 欧美主要经济体将公布11月采购经理人指数(PMI),市场关注经济复苏动能是否延续 [1] - 德国10月生产者价格指数(PPI)与欧元区11月消费者信心指数初值将于20日公布 [6] - 欧盟委员会的秋季经济展望报告将于17日发布 [6] 英国经济与政策展望 - 英国11月26日预算案受关注,报道称工党政府已搁置提高所得税的计划 [6] - 货币市场对英国央行下月降息的概率定价为84%,部分分析师预计降息可能推迟至明年2月 [6] - 英国将于19日发布10月生产者价格数据,21日公布11月采购经理人指数初值 [7] 大宗商品市场 - 国际油价结束周线两连阴,WTI原油近月合约周涨0.57%至60.09美元/桶,布伦特原油近月合约周涨1.19%至64.39美元/桶 [4] - 乌克兰对俄罗斯新罗西斯克港的无人机袭击以及美国制裁开始影响俄罗斯石油出口,推动油价走高 [4] - 国际能源署指出受制裁的原油在运输途中或水上储存的数量大幅增加是推动油价上涨的重要因素 [4] - 纽约商品交易所11月交割的COMEX黄金期货涨2.21%,报4087.60美元/盎司 [4] 美股及中概股财报 - 美股财报季临近尾声,人工智能龙头企业英伟达业绩受关注 [3] - 沃尔玛、塔吉特等零售商财报将显示美国消费者需求状况 [3] - 多家中概股将公布三季度运营状况,包括百度、网易、携程、拼多多、蔚来汽车等 [3] 地缘政治与能源动态 - 乌克兰总统泽连斯基开启欧洲之行,预计与希腊签署价值20亿欧元(23亿美元)的天然气进口协议 [13] - 由于俄罗斯空袭导致能源基础设施受损,乌克兰能源产量不足,需进口天然气以弥补不足 [13] 公司动态与合作协议 - 容百科技与宁德时代签署合作协议,宁德时代将公司作为其钠电正极粉料第一供应商 [23] - 复旦微电公告国盛投资拟受让复芯凡高持有的12.99%股份,将成为公司第一大股东 [23] - 华为将于11月21日发布AI领域突破性技术,可将算力资源利用率从行业平均的30%-40%提升至70% [17] 行业技术进展 - 宇树科技创始人表示,AI技术将赋予机器人真正"理解世界"的能力,其人形机器人已能完成绝大部分工作动作 [18] - 我国科研团队通过分析嫦娥六号月背样品,首次发现大型撞击事件成因的微米级赤铁矿和磁赤铁矿晶体 [12] 中国铁路客运数据 - 今年1至10月,全国铁路发送旅客39.5亿人次,同比增长6.4%,创历史同期新高 [12]