Workflow
AI推理
icon
搜索文档
广发证券:SRAM提升AI推理速度 相关架构进入主流大厂视野
智通财经· 2026-02-27 15:35
SRAM在AI芯片架构中的核心优势 - SRAM作为集成在CPU/GPU计算核心附近的片上存储 具备纳秒级访问时延与高度确定性的带宽特性 但容量小且成本高 [1] - 在大模型应用中 相比依赖外置HBM SRAM可显著降低权重与激活数据的访问延迟与抖动 从而改善Time-to-First-Token与尾时延表现 [1][2] - Groq的LPU单芯片集成约230MB片上SRAM 存储带宽高达80TB/s 而GPU片外HBM的内存带宽约为8TB/s [2] - Cerebras的WSE-3芯片集成44GB SRAM 片上存储带宽达21PB/s [3] SRAM架构AI芯片的性能表现 - 以Llama 3 70B模型为例 Groq LPU芯片在不同上下文长度下均能维持稳定推理速度 达275-276 token/s 显著优于其他推理平台 [2] - Cerebras WSE-3芯片在OpenAI GPT OSS 120B推理任务中实现超过3000 tokens/s的输出速度 较主流GPU云推理快约15倍 [3] - OpenAI在Cerebras AI加速器上运行的GPT-5.3-Codex-Spark预览版 支持超过1000 tokens/s的代码生成响应速度 [3] SRAM架构获得产业巨头认可并进入主流视野 - 2025年12月 英伟达斥资200亿美元获得Groq知识产权的非独家授权 包括其语言处理单元和配套软件库 并引入Groq核心工程团队 [1][4] - 2026年2月 Cerebras完成10亿美元F轮融资 估值达230亿美元 [4] - 2026年2月 OpenAI与Cerebras签署100亿美元合同 部署多达750兆瓦的定制AI芯片 [1][4] 投资观点总结 - AI记忆持续扩展模型能力边界 AI Agent等应用加速落地 [5] - AI记忆相关上游基础设施的价值量与重要性将不断提升 [5]
欧洲头部数据中心运营商再度提价,低费率云计算ETF华夏(516630)涨超1.3%,云天励飞20cm涨停
21世纪经济报道· 2026-02-27 14:52
算力租赁板块市场表现 - 2月27日午后,算力租赁板块延续强势,云计算ETF华夏(516630)涨幅为1.33%,成分股云天励飞20cm涨停,拓维信息涨停,云赛智联、润和软件、汉得信息等股跟涨 [1] 算力服务提价事件 - 欧洲最大数据中心运营商之一Hetzner宣布,由于IT多个领域成本大幅上涨,将于4月1日起调高全线产品及服务报价 [1] - 此次调价影响其位于欧洲、美国和新加坡数据中心的新订单及现有订阅用户 [1] - 德国及芬兰地区的云服务价格根据配置等级不同,涨幅在30%到38%之间;美国地区的CCX专用vCPU云服务器价格普遍上涨约30% [1] - 这是Hetzner本月第二次宣布提价,该公司于2月2日已调高专用服务器的一次性设置费用 [1] 行业观点与趋势分析 - 中银证券指出,随着模型能力提升,智能体与多模态应用进入深水区,算力涨价成为新迹象,凸显供应瓶颈,算力产业链有望持续受益 [1] - 中信证券认为,token的爆发式增长本质上反映出AI推理需求的指数级扩容,国产算力凭借成本优势及不断完善的生态,有望在基础设施层逐步占据主导 [2] - 中信证券建议重点关注由超节点互联密度提升带来的价值重估机遇 [2] 相关投资产品信息 - 云计算ETF华夏(516630)聚焦国产AI软硬件算力,其跟踪指数中,计算机软件+云服务+计算机设备合计权重高达84.3%,场内综合费率仅0.20% [3] - 通信ETF华夏(515050)深度聚焦电子与通信算力硬件,前五大持仓股为中际旭创、新易盛、立讯精密、工业富联、兆易创新 [3] - 创业板人工智能ETF华夏(159381)跟踪指数权重一半集中在光模块CPO板块,另一半覆盖AI软件应用领域,前两大权重股为中际旭创(14.27%)和新易盛(13.00%),目前基金规模近20亿元,场内综合费率仅0.20% [3]
补齐AI推理拼图:英伟达黄仁勋揭秘Groq LPU整合路线图
搜狐财经· 2026-02-27 11:45
收购与战略整合 - 英伟达以价值200亿美元(约合1370.47亿元人民币)的非授权收购Groq,并将其重要性与此前收购Mellanox相提并论,暗示Groq将在公司AI版图中发挥革命性基础作用 [1] - 收购的核心整合计划与架构整合细节将于下月召开的GTC 2026大会上公布 [1] - 此次收购的战略目标是补齐AI推理阶段的短板,特别是实现对延迟极度敏感的“解码”环节的行业标杆能力,而公司现有的Hopper、Blackwell及Rubin CPX架构已主导训练市场并覆盖推理的“预填充”阶段 [1] 技术路线与行业趋势 - 行业正加速迈向要求极低延迟和超快响应速度的多智能体协同时代 [1] - Groq的语言处理单元采用片上SRAM,能够提供每秒数十TB的内部超高带宽,此技术路线亦被Cerebras和微软等巨头采用 [2] - 引入LPU技术可使AI智能体在几秒内完成复杂逻辑推理,有效打破多智能体协作时的算力瓶颈 [2] 产品与方案预测 - 市场预测英伟达将在GTC大会上推出名为“LPX机架”的混合计算方案,该方案预计在单个机架内集成256个LPU单元 [4] - 在硬件互联方面,LPU之间将采用原生的准同步芯片间协议连接,而LPU与GPU之间则有望通过NVLink Fusion技术互联,以在预填充阶段高效处理来自GPU的海量KV缓存卸载 [4]
英伟达2026财年Q4营收681亿美元,数据中心业务占比超91%
新浪财经· 2026-02-27 10:58
财报核心业绩 - 2026财年第四季度总营收达681.3亿美元,同比增长73%,创历史单季新高 [1][9][10] - 第四季度GAAP净利润达429.6亿美元,同比增长94%,相当于日均净利润超过4.7亿美元 [1][9][10] - 第四季度毛利率为75.0%,同比提升2个百分点 [9] - 第四季度经营活动现金流为361.9亿美元,同比增长117% [9] - 公司给出下一季度营收指引为780亿美元,同比增长75% [6][9] 业务结构分析 - 数据中心业务是增长绝对核心,第四季度收入达623.1亿美元,占总营收比例历史性突破91.5% [1][7] - 数据中心业务内部,计算部分收入为513.3亿美元,网络部分收入为110亿美元 [7] - 网络业务收入同比暴增263%,增速最快,表明AI集群对高速互联需求同步上涨 [1][7] - 游戏业务收入占比为5.5%,短期承压;专业可视化与汽车业务稳健增长,但已非当前增长主线 [7] 增长驱动力与战略 - 所有增长几乎全部由数据中心业务驱动,公司已从游戏显卡公司彻底转变为全球AI基础设施核心供应商 [1] - 公司通过“计算芯片+高速网络”的系统级方案(如NVLink)构建护城河,CEO黄仁勋将其描述为“AI工厂”或“算力工厂”解决方案 [1] - 公司正积极布局AI推理市场,其Blackwell平台在推理性能上已具优势,下一代Vera Rubin平台号称能将推理token成本再降低10倍 [2] 市场竞争与行业趋势 - AI推理市场被视为下一战场,其追求极致性价比,用户量越大、调用越频繁,算力需求越庞大,市场规模甚至远超训练本身 [2] - 在推理场景,谷歌的TPU、AMD的MI系列以及各大云厂商的自研芯片(ASIC)正试图抢占市场份额 [2][6] - 公司策略明确,不仅要在AI训练市场占据绝对领先,也要在规模更大、更长尾的推理市场中定义标准 [2] 风险与不确定性 - 地缘政治与出口管制是最大不确定性,公司下一季度营收指引明确不含任何来自中国的数据中心计算收入 [2][6] - 考虑到中国AI处理器潜在年市场规模高达500亿美元,出口管制政策的走向将直接影响公司长期增长天花板 [2] - 市场情绪开始从“无脑追涨”转向关注增长持续性和地缘政治风险 [6] 市场关注点与未来展望 - 市场关注点集中在Blackwell/Rubin平台的产能爬坡节奏、出口管制对中国市场的长期影响,以及AI推理需求能否成为下一个增长引擎 [3] - 公司全年(FY2026)营收为2159.4亿美元,净利润为1200.7亿美元 [10] - 公司股价为195.56美元,近一年上涨55%,市值达4.75万亿美元,市盈率(TTM)约48倍 [9]
海力士+闪迪,存储芯片巨头力推 HBF 标准化
36氪· 2026-02-27 10:56
行业技术演进 - 存储芯片行业正经历技术迭代 HBM技术持续进化 同时新型内存HBF的商业化进程正在加快[1] - HBF技术的标准化启动 标志着下一代存储架构的竞争进入实质阶段[2] - HBF的出现是为了解决AI推理时代存储架构的瓶颈 旨在填补HBM与SSD之间的空白 提供兼具高带宽、大容量与高性价比的解决方案[2] HBF技术解析 - HBF是一种经架构重构与封装优化的新型存储半导体 借鉴HBM的3D堆叠技术 将存储介质替换为NAND闪存 并通过硅通孔技术实现高速数据传输[3] - 其采用CMOS直接键合到阵列设计 实现独立访问的存储器子阵列 大幅提升数据并行访问能力[3] - 单堆栈HBF容量可达512GB 8个堆栈可实现4TB容量 足以高效支撑大模型参数的高速读取需求[3] 市场应用与产业协同 - HBF并非要取代HBM 而是与之协同构建高效AI存储架构 HBM负责延迟敏感型任务 HBF专注于大容量顺序读取工作[4] - SK海力士推出的“H3混合架构”验证了该逻辑 仿真测试显示其每瓦性能较纯HBM方案最高提升2.69倍 在1000万token场景下并发查询量提升18.8倍 GPU使用量大幅减少[4] - 全球存储巨头纷纷加码布局 SK海力士与闪迪联手推进标准化 三星电子也已加入阵营 共同推动产业协同[6] 商业化前景与时间线 - 三星与闪迪计划在2027年底至2028年初 将HBF技术集成至英伟达、AMD、谷歌的相关产品中[6] - 闪迪预测首批HBF产品将于2026年下半年出样 搭载HBF的AI推理设备则将于2027年初出样[6] - 业界预计HBF的市场需求将于2030年进入快速增长通道 2038年市场规模有望超越HBM[6] 当前挑战 - HBF存在NAND闪存写入速度偏慢的固有短板 在缓存动态更新场景中可能影响用户体验[7] - HBF与现有GPU架构的兼容性、封装复杂度及设备散热等问题 仍需整个行业协同攻关解决[7]
AI发展驶入“回归商业本质”阶段 国产芯片迎“推理机遇”
上海证券报· 2026-02-27 01:59
OpenAI资本支出调整与行业影响 - OpenAI将2030年前AI基础设施支出目标从1.4万亿美元下调至6000亿美元,新目标为聚焦芯片采购与租赁的纯算力专项支出 [2][3] - 业界认为此举并非预算削减,而是从“8年广义基建”口径调整为“5年算力专项”,是行业从烧钱增长转向“投入产出匹配”的理性回归,标志着产业发展进入更务实阶段 [2][3] - 高盛等机构认为,6000亿美元资本支出与OpenAI“2030年营收2800亿美元”的目标更契合,有助于其融资推进,该支出仍是全球最大算力投入,显示增长动能澎湃 [3] - OpenAI提出到2030年实现消费者业务与企业业务收入基本持平,摩根士丹利认为这是其跑通商业模式的表现 [4] 算力产业链持续高景气 - 北美云厂商与AI企业继续大力投资,Meta与英伟达达成价值数十亿美元的芯片采购协议,将采购数百万片英伟达最新AI加速芯片,并大规模部署英伟达CPU [2][5] - 业界认为OpenAI调整支出短期情绪上可能利空英伟达产业链,但长期看订单确定性更强,有助于AI推理规模化部署及产业链景气度持续 [3] - 国内AI ASIC龙头企业芯原股份截至2025年末在手订单金额达50.75亿元,较三季度末的32.86亿元大幅提升54.45%,且已连续九个季度保持高位 [8] AI应用商业化加速与投资机遇 - 在“盈利优先”背景下,AI应用商业化落地正在加速,行业正从“算力军备竞赛”迈入“商业化验证期” [5] - 千问在春节假期用户“一句话下单”近2亿次,2月7日其日活跃用户数达7352万,接近豆包的7871万,仅用3个月达到后者3年的用户规模 [5] - 算力利用率高、盈利性强的AI公司有望率先收获红利,建议重点关注“AI+医疗”、“AI+营销”、“AI+企服”、“AI+编程”、“AI+娱乐”等细分赛道 [6] - AI大模型正从“单一超大模型”向“多模型+专用模型+MoE”演进,以降低对高端算力依赖并提升能效比,具备细分赛道模型及应用并跑通商业模式的公司值得关注 [6] - 生成式引擎优化作为AI应用率先落地方向,市场规模迅速提升 [6] - 利欧集团在数字营销领域打造专属AI智能体矩阵,在泵与系统领域推出数据中心冷却系统解决方案 [6] AI推理算力成为新风口 - 随着AI发展重心转向应用,算力需求由“重训练”转向“训练+推理并重”,AI推理需求成为新风口,增长速度和规模将远超AI训练 [7] - 云天励飞董事长预计,2026年是AI发展核心推动力由训练转向推理的转折之年,到2030年全球AI训练算力市场达1万亿美元,而AI推理市场规模将达4万亿美元至5万亿美元 [7] - AI推理更讲究性价比,需要在成本、效率和系统能力上建立优势,让定制化AI芯片脱颖而出 [7] - 初创公司Taalas发布首款ASIC产品Taalas HC1芯片,专为Llama 3.1 8B模型优化,采用30芯片集群时实现每秒12000 tokens推理速度,较传统GPU方案提升50倍能效,成本降低至1/20,功耗降低至1/10 [7] 国产AI芯片发展态势 - AI推理需求爆发,国产AI算力芯片正借助ASIC、全栈优化等技术在该赛道建立竞争优势 [8] - 寒武纪、摩尔线程、沐曦股份已登陆科创板,壁仞科技、天数智芯已登陆港交所,燧原科技在冲刺IPO,百度计划分拆昆仑芯在港上市 [8] - 海光信息同时具有“DCU+CPU”芯片,并与中科曙光合作形成产业链优势 [8]
容量碾压HBM 10倍!SK海力士联手闪迪,启动HBF全球标准化
硬AI· 2026-02-26 18:27
文章核心观点 - SK海力士与闪迪联手在开放计算项目框架下成立工作组,旨在推进高带宽闪存全球标准化,该技术被定位为填补HBM与SSD之间层级空白的关键解决方案,专为AI推理优化,计划于2027年商业化,其长期市场规模有望超越HBM [2][3][6] HBF技术定位与价值 - HBF的核心价值在于构建一个介于超高速HBM与大容量SSD之间的全新存储层级,以解决AI推理场景下高容量数据处理与功耗效率难以兼顾的矛盾 [5][6] - HBF通过垂直堆叠NAND闪存实现,在维持高带宽的同时提供约10倍于HBM的存储容量,旨在弥合HBM带宽卓越但容量有限、SSD容量充裕但读写速度不足的差距 [6] - 在系统架构中,HBM负责处理高级别带宽需求,HBF作为支撑层承接容量扩展任务,两者协同覆盖AI推理对海量数据处理与功耗效率的双重要求 [6] - HBF在提升AI系统可扩展性的同时,还有望降低总拥有成本,AI推理市场的竞争正从单芯片性能比拼转向CPU、GPU与存储器的全栈解决方案能力优化 [6] 标准化进程与产业合作 - SK海力士与闪迪在OCP框架下成立专属工作组,推进HBF标准化工作,标志着该技术的标准化从双边协议走向更大范围的产业协同 [3][7] - SK海力士与闪迪均具备HBM及NAND领域的设计、封装与量产经验,三星电子与SK海力士均已与闪迪签署谅解备忘录,共同推动HBF标准化 [6] - 公司表示,HBF技术标准化将帮助构建协作体系,为客户呈现AI时代优化的存储架构,其关键在于超越单项技术性能竞争,实现整个生态系统的优化 [3][8] 商业化预期与市场前景 - 被称为“HBM之父”的韩国科学技术院教授预计,HBF的落地节奏较此前预期明显提前,三星电子与闪迪计划于2027年底至2028年初将HBF集成至英伟达、AMD及谷歌的产品中 [3] - 长期来看,HBF的市场规模有望于2038年前后超越HBM,其商业化周期将远短于当年HBM的开发历程,这得益于HBM积累的工艺与设计经验 [4][10] - 业界预计HBF相关存储解决方案的需求将于2030年前后进入快速增长阶段,驱动其需求的根本逻辑在于AI工作负载持续增长及行业向推理阶段转型 [4][10] - 能够同时提供HBM与HBF的全栈存储解决方案供应商战略地位将持续提升,率先在OCP框架下掌握标准化话语权的企业有望在新兴市场中占据先机 [4][10]
美股异动丨闪迪盘前涨超5%,携手SK海力士启动下一代存储器“HBF”全球标准化进程
格隆汇· 2026-02-26 17:22
公司股价与市场反应 - 闪迪(SNDK.US)盘前股价上涨超过5%,报665美元 [1] 行业技术动态与战略发布 - SK海力士与闪迪联合举办“HBF规格标准化联盟启动会”,正式发布面向AI推理时代的下一代存储器解决方案HBF的全球标准化战略 [1] - HBF是一种介于高频宽记忆体和固态硬碟之间的新型储存阶层,旨在弥合HBM高效能与固态硬碟大容量特性之间的差距 [1] - HBF旨在满足AI推理场景对容量扩展性与能源效率的双重需求 [1] 市场前景与预测 - 业界普遍预测,以HBF为关键零组件的整合式记忆体解决方案,市场需求将在2030年左右迎来全面扩张 [1]
SK海力士联手闪迪,启动HBF标准化,容量碾压HBM 10倍!
华尔街见闻· 2026-02-26 15:41
合作与标准化进程 - SK海力士与闪迪在开放计算项目框架下成立专属工作组,正式推进高带宽闪存全球标准化工作 [1] - HBF标准化工作正从三星电子、SK海力士与闪迪之间的双边协议,走向OCP平台下更大范围的产业协同 [3] - 此次标准化旨在构建协作体系,为整个AI生态系统的共同成长与优化奠定基础 [1][3] 技术定位与价值主张 - HBF被定位为填补HBM与SSD之间层级空白的关键解决方案,专为AI推理时代设计 [1] - 其核心价值在于构建一个介于超高速HBM与大容量SSD之间的全新存储层级,以解决AI推理场景下高容量数据处理与功耗效率难以兼顾的矛盾 [2] - HBF通过垂直堆叠NAND闪存,在维持高带宽的同时,提供约10倍于HBM的存储容量 [2] - 该技术旨在提升AI系统可扩展性,并有望降低系统的总拥有成本 [2] 商业化预期与市场前景 - 被称为“HBM之父”的Kim Joungho教授预计,HBF的落地节奏较此前预期明显提前 [1] - 三星电子与闪迪计划于2027年底至2028年初将HBF集成至英伟达、AMD及谷歌的产品中 [1] - 业界预计HBF相关存储解决方案的需求将于2030年前后进入快速增长阶段 [1] - 长期来看,HBF市场规模有望于2038年前后超越HBM [1][4] 行业竞争格局与驱动力 - 能够同时提供HBM与HBF的全栈存储解决方案供应商,其战略地位将持续提升 [1][5] - AI行业正从训练阶段加速向推理阶段转型,推理场景对快速、高效、大容量存储的需求急剧攀升,驱动HBF需求 [4] - 得益于HBM积累的工艺与设计经验,HBF的商业化周期将远短于当年HBM的开发历程 [4] - 在OCP框架下率先掌握标准化话语权的企业,有望在2030年前后需求提速的新兴市场中占据先机 [5]
Token出海趋势确立,国产算力核心受益,关注半导体设备ETF易方达(159558)等产品配置价值
每日经济新闻· 2026-02-26 14:38
国产算力板块市场表现 - 2月26日,国产算力板块表现活跃,中证半导体材料设备主题指数上涨1.2%,上证科创板芯片设计主题指数上涨2.0% [1] 国产大模型近期进展与变化 - 春节以来国产大模型迎来三大变化:字节Seedance2.0产品力超预期,国产多模态进入全球第一梯队并加速海外渗透 [1] - 豆包、元宝、千问等假期表现亮眼,其中豆包成为字节历史上推广费用最少的DAU破亿产品 [1] - 智谱、MiniMax商业化价值重估,算力需求持续旺盛 [1] 国产模型市场份额与需求 - OpenRouter最新周度数据显示,平台前十模型总token量中,中国模型占比超60%,前三甲均为国产大模型 [1] - token爆发式增长本质反映AI推理需求的指数级扩容 [1] 国产算力竞争优势与发展前景 - 国产算力凭借成本优势及不断完善生态,有望在基础设施层逐步占据主导 [1] 相关指数成分与投资标的 - 中证半导体材料设备主题指数聚焦半导体材料和设备领域,半导体设备行业占比63%,半导体材料行业占比23% [1] - 上证科创板芯片设计主题指数聚焦芯片设计领域,数字芯片设计和模拟芯片设计行业分别占比为77%和18% [1] - 投资者可借道半导体设备ETF易方达(159558)、科创芯片设计ETF易方达(589030)布局国产算力核心标的 [1]