Workflow
英伟达推理芯片
icon
搜索文档
英伟达的“神秘芯片”背后:推理时代开启“四大算力新趋势”
华尔街见闻· 2026-03-01 21:53
行业趋势:AI算力竞争主战场从训练转向推理 - 英伟达计划发布整合Groq LPU技术的新推理芯片,OpenAI已同意成为其最大客户之一 [1] - OpenAI同时与初创公司Cerebras达成数十亿美元合作,表明AI巨头正从训练算力竞赛转向推理算力的多线布局 [1] - 申万宏源研究认为,2026年算力产业的核心关键词将是推理,Token消耗总量与技术范式将围绕此主题深度重构 [1] 推理算力发展的四大趋势 - 纯CPU部署场景增多,低成本推理需求加速算力下沉 [2] - LPU等专用架构崛起,挑战GPU在推理环节的主导地位 [2] - 国产算力芯片加速突破,供应链多元化趋势明确 [2] - 推理需求结构从“单次训练”向“海量Token消耗”转变,性价比成为核心竞争要素 [2] 推理需求爆发的驱动因素与数据表现 - 大模型货币化加速(如Claude发布行业插件)以及Agent落地提速(如openclaw、千问Agent),驱动推理需求扩张 [3] - 春节期间,国内头部大模型推理量大幅增长:豆包除夕当天推理吞吐量达633亿tokens,元宝月活跃用户达1.14亿,千问“春节大免单”活动参与人数超1.2亿 [3] - OpenRouter数据显示,2月9日至15日当周,中国模型调用量以4.12万亿Token首次超过美国模型的2.94万亿Token;16日至22日当周,中国模型调用量进一步冲高至5.16万亿Token,三周大涨127% [3] 技术架构演进:LPU崛起与芯片分工 - 英伟达斥资200亿美元获取Groq核心技术许可,标志着纯推理芯片的重要性获顶级玩家认可 [6] - LPU针对推理场景的延迟和内存带宽瓶颈优化,效率优势明显;英伟达新品可能涉及下一代Feynman架构或3D堆叠技术整合LPU [6] - 未来AI芯片将形成明确分工:训练端沿用GPU-HBM组合,推理端演进为ASIC+LPU-SRAM+SSD的组合方案 [6] 系统层面革新:三层网络架构 - 应用场景从chatbot转向Agent,推动算力系统架构向三层网络演进 [7] - 第一层快反应层由搭载SRAM的纯推理芯片提供低延迟反馈 [7] - 第二层慢思考层使用超大吞吐算力集群负责复杂逻辑推演,多核多线程CPU需求将显著增加 [7] - 第三层记忆层对应英伟达的ContextMemory System,通过DPU管理的SSD存储长期记忆 [7] - 英伟达与Meta完成首次大规模纯CPU部署,标志着公司正超越单一GPU销售模式 [7] 国产算力芯片的突破 - 新一代国产推理芯片在技术层面实现多项提升:支持FP8/MXFP8/MXFP4等低精度格式,算力达1P和2P;向量算力大幅提升;互联带宽相比前代提升2.5倍至2TB/s [9] - 芯片层面实现PD分离,推出面向Prefill的PR版本(采用低成本HBM)和面向Decode的DT版本,PR版本预计于2026年Q1推出 [9] - 供应链国产化进程加快:某头部封测企业2.5D封装业务收入从2022年的0.5亿元快速增长至2024年的18.2亿元,印证国产算力芯片供给能力提升 [9]
大科技海外周报第6期:半导体关注AI模型迭代对端云飞轮的加速作用-20260301
华福证券· 2026-03-01 17:26
行业投资评级 - 强于大市(维持评级)[6] 核心观点 - 报告核心观点为关注AI模型迭代对“端云飞轮”的加速作用[1][2] - 年初以来国产AI大模型营销加速了端云飞轮的转动[2] - 端云飞轮的加速转动及大模型的持续迭代,将使AI Agent变得越来越好用,并带动端侧AI硬件载体迎来新的市场机遇[2] 行业趋势与驱动因素 - **云端算力需求增长逻辑**:算力需求=用户规模×调用频率×单次复杂度,年初的大模型营销显著提升了用户规模和调用频率[2] - **“端云飞轮”效应**:用户增多带动数据回流增加→模型参数扩张→推理模型规模提升,形成“模型升级→端侧用户数提升→数据回流→模型再升级”的正向循环[2] - **端侧AI产品创新**:当前市场上AI眼镜、AI玩具、具身智能机器人等端侧AI产品层出不穷,公众对智能AI Agent的需求强烈且未被很好满足[2] - **AI眼镜市场前景**:IDC预测,2026年全球智能眼镜市场出货量预计将突破**2368.7万台**,其中中国智能眼镜市场出货量将突破**491.5万台**,市场迈入规模化增长新阶段[3] - **算力产业链趋势**:英伟达计划在GTC开发者大会上发布整合了Groq LPU技术的全新推理芯片,代表其正加速向推理计算领域转型[4] 重要事件与时间节点 - 千问AI眼镜将于**3月2日**发布,并计划在年内陆续发布AI指环、AI耳机等产品,面向全球市场发售[3] - 英伟达GTC大会将于**3月16日-19日**在美国召开,将展示物理AI、AI工厂、代理式AI和AI推理等领域的突破性成果[4] 建议关注的投资方向与公司 - **端侧AI**:龙旗科技、立讯精密、统联精密、歌尔股份、蓝思科技、恒玄科技、汇顶科技、华灿光电、中科蓝讯、紫建电子、佳禾智能、润欣科技、豪鹏科技、乐创技术等[5] - **国产CPU**:海光信息、龙芯中科、禾盛新材等[5] - **空间激光通信**:烽火通信、睿创微纳、中润光学、金橙子、航天电子、苏大维格等[5] - **手机直连卫星通讯**:手机端关注电科芯片、海格通信、国博电子、华力创通等;卫星端关注复旦微电、臻镭科技、国博电子、信维通信等[5] - **半导体国产替代**: - 材料:雅克科技、鼎龙股份、安集科技、上海新阳、兴福电子、金宏气体、华特气体、艾森股份、华海诚科、江丰电子、凯美特气、和远气体等[5] - 设备及零部件:拓荆科技、北方华创、中微公司、芯源微、盛美上海、华海清科、华峰测控、长川科技、富创精密、珂玛科技、新莱应材等[5] - Fab(晶圆制造):华虹半导体、中芯国际、华润微、晶合集成、芯联集成等[5]
金价跌了,白银还在涨!再创历史新高!警惕→
搜狐财经· 2025-12-25 13:42
美股市场 - 美国三大股指集体收涨 道指涨0.60% 标普500指数涨0.32% 纳指涨0.22% [2][4] - 道指与标普500指数创收盘历史新高 [2][4] - 市场交投清淡 “恐慌指数”VIX跌至一年来新低 投资者对短期风险的担忧缓解 [4] - 市场预计美联储明年至少降息两次 降息预期拉动房地产、金融等周期股普遍上涨 [4] 贵金属市场 - 国际金价在站稳每盎司4500美元关口并创历史新高后微跌 纽约商品交易所明年2月黄金期价收于每盎司4502.8美元 跌幅0.06% [1][6] - 白银期价延续强劲涨势 连续第四个交易日创历史新高 纽约商品交易所明年3月白银期价收于每盎司71.685美元 涨幅0.77% [1][8] - 银价上涨受美联储降息预期、工业与投资需求增加推动 但快速攀升包含大量投机头寸 存在短线大幅回调风险 [1][8] 原油市场 - 国际油价小幅下跌 投资者谨慎看待美国石油消费需求增长前景 [10] - 纽约商品交易所明年2月轻质原油期货价格收于每桶58.35美元 跌幅0.05% [10] - 伦敦布伦特原油明年2月期货价格收于每桶62.24美元 跌幅0.22% [10] 科技行业(英伟达) - 英伟达与AI芯片设计初创公司Groq达成非独家授权协议 而非以约200亿美元现金收购 [12] - Groq核心创始人和部分高管将加入英伟达 利用其高性能AI推理加速芯片技术拓展英伟达推理芯片业务 旨在降低芯片算力成本 [12] - Groq核心创始人曾是谷歌张量处理器芯片TPU的重要研发人员 [12] - 英伟达股价周三小幅收跌0.32% [12] 欧洲股市 - 欧洲多国股市因节假日休市或提前收市 市场交投清淡 [15] - 英国股市收跌0.19% 法国股市微跌0.0033% [13][15] - 部分零售、非必需消费品蓝筹股表现不佳 [15]