AI推理
搜索文档
周观点:重视AgenticAI时代下CPU产业机遇-20260125
国盛证券· 2026-01-25 16:12
报告行业投资评级 - 增持(维持)[6] 报告的核心观点 - 重视Agentic AI时代下CPU产业机遇,AI推理服务与通用服务器更新周期将拉动CPU需求,而供给端受先进制程良率低、AI芯片挤占产能等因素限制,导致供需失衡,引发服务器CPU涨价[1] - AI运算架构升级推动存储器市场进入超级周期,DRAM与NAND Flash需求旺盛、价格持续上涨,带动整体产业产值再攀高峰[3] 根据相关目录分别进行总结 一、AI agent 拉动 CPU 需求,供需缺口引发涨价 - **需求端动力强劲**:AI推理服务发展推动云服务商(CSP)资本支出增长,预计2026年北美五大CSP资本支出总额年增率高达40%[11],这带动了服务器更新与扩张周期,预计2026年全球所有服务器出货量将年增12.8%,AI服务器出货量年增28.3%[1][12] - **技术变革提升CPU重要性**:DeepSeek发布的Engram架构成功演示将1000亿参数嵌入表存储在CPU DRAM中,通过PCIe通道异步搬运数据至GPU,带来的额外推理延迟不到3%[1][16][19],这凸显了CPU在AI系统中的关键作用,特别是在Agentic AI系统中,CPU成为主要性能瓶颈,其上的工具处理延迟占总延迟比例高达90.6%[20] - **供需失衡导致涨价**:需求激增而供给受限(先进制程良率低、AI芯片挤占产能),英特尔与AMD的2026年服务器CPU产能已基本售罄[1][21],计划同步涨价,其中主流型号涨10%-15%,高端AI型号涨15%-20%[1][21],涨价将传导至全产业链,同时为国产CPU扩大市占率提供机会[1][21] - **英特尔个案分析**:英特尔2025年第四季度营收达137亿美元,同比下降4%,全年营收529亿美元,同比微降0.4%,业绩受到供给约束影响[2][22],其数据中心和人工智能(DCAI)业务在25Q4营收达47亿美元,同比增长9%,环比增长15%,表现强劲[2][28],公司预计2026年第一季度内部供应限制最为严峻,营收指引为117-127亿美元(中值同比下降4%)[2][37],但18A制程良率持续改善,产能将从26Q2开始提升,DCAI业务有望迎来强劲一年[2][36][37] 二、AI 运算架构升级,存储器市场产值再攀高峰 - **存储器市场进入超级周期**:AI服务器建置提速推动存储器需求,DRAM与NAND Flash合约价涨势预期将延续至2027年[3][42],带动整体存储器产业产值逐年创高,预估2026年达5516亿美元,2027年达8427亿美元,年增53%[3][42] - **DRAM市场增长迅猛**:在数据存取高需求带动下,2025年DRAM产值达1657亿美元,同比增长73%[3][40],预计2026年产值将达4043亿美元,年增率高达144%[3][40],价格方面,去年第四季涨幅已达53-58%,预期今年第一季将有60%以上涨幅,部分产品线报价近翻倍[40] - **NAND Flash市场同步高涨**:2025年NAND Flash产值达697亿美元[3][41],预计2026年产值将达到1473亿美元,年增率为112%[3][41],AI Agent对高IOPS企业级SSD的需求推升报价,预估今年第一季价格季增幅为55-60%[41] - **近期市场价格全线上涨**:本周DRAM OEM市场报价全线上涨,D4容量涨幅区间在8%-19%,D3容量涨幅区间在17%-22%[45][46],Flash Wafer原厂合约价全线上涨约13%–23%[49][50],SSD与USB市场报价也持续上涨[50][51],市场呈现结构性缺货,下游成本压力增大[45][49] 三、相关标的 - 报告列出了多个产业链相关标的,涵盖CPU、存储模组、存储芯片、半导体设备、半导体材料、封测及国产算力底座等领域[53],具体包括香农芯创、东山精密、兆易创新、北方华创、中微公司、胜宏科技等公司,并提供了其投资评级及盈利预测[8]
曦望1年内累计获得近30亿元融资,以差异化路径「重写中国AI产业损益表」
IPO早知道· 2026-01-23 19:50
公司基本情况 - 公司曦望(Sunrise)是国内首家All-in推理的GPU芯片公司,前身为商汤科技大芯片部门,于2020年成立,2024年底完成与商汤的分拆 [4][5] - 公司在一年内完成近30亿元融资,截至2025年6月已累计募得近10亿元融资 [4][5] - 投资方阵容豪华,包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,并获得诚通混改基金等国资背景资本加持 [3][5] 团队与研发实力 - 联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,曾带领百人团队成功主导公司两代芯片的研发和量产 [6] - 联席CEO王湛为百度创始团队成员、原集团副总裁,于2025年初加入,负责公司产品化和商业化 [6] - 团队规模约300人,主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验 [6] - 公司全栈自研指令集、GPGPU IP及编译工具链,拥有200余项核心专利,并具备百人团队“一次流片成功”的经历 [8] 产品与技术路径 - 公司聚焦推理场景进行原生架构重构,在调度、缓存、片上SRAM、互联及编译器路径上深度优化,并结合LPDDR内存技术,从根源降低单位Token的推理成本 [7][8] - 已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求 [11] - 2020年量产的S1芯片可适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [12] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型 [12] - 2026年即将推出的S3芯片目标在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [12] 商业化进展与市场验证 - 2025年,公司与数十家行业领先企业达成战略合作,业务成功拓展至政府智算中心、AI平台、信创、医疗、能源等国家重点领域,实现了营业收入的高速增长 [9] - 公司产品顺利完成在多家大型国央企及重点实验室的官方测试,并获得标杆客户高度评价,同时稳步推进与主流服务器厂商及国产CPU的深度适配 [9] - 公司大模型推理性能已跻身第一梯队,现有产品在多项主流大模型推理任务中展现出顶级性能,并获得业内权威机构认证 [9] - 自研一站式MaaS平台已启动内测,成功接入并优化语言、图像、视频等多模态模型,有效降低AI应用门槛 [9] 公司战略与行业定位 - 公司战略定位为“推理分流与成本优化层”,不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,目标让推理成本下降90%并提供更稳定的服务 [12] - 公司目标是通过极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力 [12] - 2026年,公司将聚焦三大核心:推动旗舰产品成功上市与规模化应用,打造市场领先的“体验标杆”和“性价比王者”;深入场景渗透,以算力赋能千行百业;以开放姿态携手产业链上下游伙伴,打通“芯片-软件-应用”全链路,推动国产算力生态繁荣 [13]
vLLM团队创业,种子轮10.5亿!清华特奖游凯超加盟
量子位· 2026-01-23 13:03
公司成立与融资 - 开源推理框架vLLM核心团队宣布创业,成立新公司Inferact [1] - 公司种子轮融资1.5亿美元(约10.5亿人民币),估值达8亿美元(约56亿人民币)[1] - 此轮融资创下近期AI基础设施领域融资新高,也是有史以来规模最大的种子轮融资之一 [2] - 融资由Andreessen Horowitz(a16z)与Lightspeed Venture Partners共同领投,红杉资本、Altimeter Capital、Redpoint Ventures及真格基金等跟投 [7] 市场背景与机遇 - 随着AI应用落地,行业焦点正从模型训练转向推理 [4] - 市场对于低成本、高可靠运行现有模型的需求,已超过对新模型研发的期待 [9] - 当应用程序需频繁与大模型交互时,算力成本和系统负载呈指数级上升,推理环节成为制约行业发展的最大瓶颈 [8] - 在推理规模化阶段,即使是微小的效率提升也能带来显著的成本节省 [6] 公司定位与产品策略 - Inferact旨在解决“推理瓶颈”,构建下一代商业引擎以应对大规模部署挑战 [5] - 公司采取双线并行策略:继续支持vLLM作为独立开源项目发展,同时开发独立的商业产品 [12][13] - 商业产品计划专注于硬件适配效率,帮助企业在不同类型硬件上运行AI模型 [14] - 公司设计独特反哺机制,利用商业资源滋养vLLM开源项目,确保其作为行业基石继续发展 [24] 技术基础与验证 - vLLM是公司的技术基石,已成为大模型领域的事实标准,几乎所有主流开源大模型在发布与部署时都将其作为首选支持的推理框架 [15] - vLLM已进入工业界实际生产环境,亚马逊已将其直接应用于自身核心购物应用的内部系统 [10] - 在万亿级商业场景、真实高并发流量下的部署,验证了技术的稳定性与大规模商业落地的确定性 [11] - vLLM的核心技术创新包括Paged Attention算法,解决了KV Cache显存碎片化问题,提升了吞吐量性能 [31] 团队背景 - CEO Simon Mo,加州大学伯克利分校EECS系背景,主攻机器学习系统设计,曾任Anyscale早期工程师,是vLLM项目的原始维护者之一 [25][26][27][28] - 联合创始人Woosuk Kwon,加州大学伯克利分校计算机科学博士,师从Ion Stoica教授,研究重点为大语言模型高效服务系统,是vLLM项目发起人及Paged Attention算法提出者 [30][31] - 核心技术力量包括清华特奖得主游凯超,曾在伯克利EECS系担任访问学者,主攻分布式深度学习系统,主导了vLLM基于张量并行的分布式推理功能实现 [33][34] - 核心团队与顾问团还包括前Roblox高级机器学习工程师Roger Wang,以及伯克利教授Joseph Gonzalez、Databricks联合创始人Ion Stoica教授等学术界与工业界资深力量 [35][36] 发展历程与行业洞察 - vLLM最初仅是创始团队在伯克利求学期间的Side Project,驱动源于“开源代码必须是全球AI基础设施的地基”的技术信仰 [17] - 项目在没有商业推广的情况下,迅速成为开发者社区的宠儿 [18] - 随着项目从实验室走向工业界,团队角色发生质变,通过与全球顶尖开发者协作,积累了独有的技术洞察并确立了行业权威 [20][21] - 团队发现,当推理任务从Demo演示变为数千张GPU集群的生产级部署时,挑战量级呈指数级上升,现有开源方案在深度底层优化、大规模集群线性扩展及复杂GPU部署流程上力不从心 [21][22] - 企业需求已从零散代码库转变为能稳定承载万亿次调用的工业级引擎,这需要引入严密的商业组织形式来构建下一代引擎 [23][24]
GPU创企曦望一年融资30亿:出身商汤,押注推理
观察者网· 2026-01-22 21:13
公司融资与资金用途 - 曦望(Sunrise)在一年内完成近30亿元人民币融资 [1] - 投资方包括华胥基金、范式智能、杭州数据集团等产业资本,IDG资本、高榕创投、无极资本等VC/PE机构,以及诚通混改基金、杭州金投、杭州高新金投等国资背景资本 [1] - 所筹资金将用于下一代推理GPU研发、规模化量产及生态共建 [1] 公司背景与团队构成 - 公司成立于2020年,前身为商汤科技大芯片部门,于2024年底分拆独立运营 [1] - 公司专注于高性能GPU及多模态场景推理芯片的研发与商业化 [1] - 公司正式员工超200人,技术和研发人员占比80%以上 [1] - 部分员工来自AMD、百度、华为海思、商汤等行业龙头,核心技术骨干平均拥有15年行业经验,硕士及以上学历占比超过80% [1] - 董事长徐冰曾任商汤科技联合创始人,负责集团战略与资本运作,带领商汤完成累计超66亿美元融资及港交所IPO [1] - 联席CEO王勇拥有20余年芯片行业经验,曾任AMD dGPU首席架构师、百度昆仑芯核心架构师,主导多款7nm高性能芯片从研发到流片及量产 [2] - 另一位联席CEO王湛曾任职百度十六年,为百度创始团队成员、前百度资深副总裁 [2] 技术路线与产品战略 - 公司选择“纯推理”路线,与英伟达等追求“训推一体”的传统GPU厂商不同 [4] - 公司在调度机制、缓存设计、片上SRAM、芯片互联及编译器路径等核心环节针对推理场景做原生深度优化,并融合LPDDR内存技术,以实现单位Token推理成本的显著降低 [4] - 公司目标是极致降低大模型推理的成本与门槛,让推理算力变得普惠,从而充分释放AGI的全部潜力 [4] - 公司宣称其技术能让推理成本下降90%,并提供更稳定的服务 [4] 研发投入与产品矩阵 - 公司在过去数年研发投入累计20亿元人民币 [4] - 已构建起三代芯片产品矩阵 [4] - 2020年量产的S1芯片是国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [4] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已适配DeepSeek、Qwen等主流模型 [4] - 计划于2026年推出的S3芯片定位为“推理性价比之王”,目标在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [5]
推理GPU芯片公司曦望累计完成近30亿元融资
北京商报· 2026-01-22 20:49
公司融资与资金用途 - 曦望Sunrise在一年内完成了近30亿元人民币的战略融资 [1] - 投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技、游族网络、北京利尔等产业投资方 [1] - 投资方还包括无极资本、IDG资本、心资本、高榕创投、中金资本、普华资本、松禾资本、易方达资本、工银投资、海通开元、越秀产业基金、银泰投资、国元基金、粤民投、华民投等国内知名VC/PE机构 [1] - 同时获得诚通混改基金、杭州金投、杭州高新金投等国资背景资本的加持 [1] - 所筹资金将专项用于下一代推理GPU的核心技术研发、规模化量产及生态共建 [1] 公司定位与战略 - 公司为国内首家All-in推理的GPU芯片公司 [1] - 融资旨在持续夯实公司在推理算力赛道的核心竞争力 [1] 行业发展趋势 - AI模型训练已迈入深水区 [1] - 推理环节的运行效率、综合成本与稳定性能,正成为左右AI技术商业化落地成败的核心关键 [1] - 全球AI产业正从“训练红利”向“推理红利”深度切换 [1]
首发丨曦望完成近30亿元战略融资,All-in推理GPU
投中网· 2026-01-22 15:07
融资事件与行业趋势 - AI推理算力赛道公司曦望一年内完成近30亿元战略融资,投资方包括多家产业资本、知名VC/PE及国资背景基金 [2] - 本轮融资资金将主要用于下一代推理GPU研发、规模化量产及生态共建 [2] - 曦望连续获得多家机构投资,折射出AI产业从“训练红利”向“推理红利”切换的核心趋势 [2] - 当模型训练进入深水区,推理环节的效率、成本与稳定性已成为决定AI商业化能否落地的关键因素 [2] 公司背景与团队构成 - 曦望成立于2020年,前身为商汤科技大芯片部门,团队从诞生之初就贴上了“更懂AI的GPU芯片公司”标签 [4] - 联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,主导了曦望两代芯片的研发和量产 [4] - 联席CEO王湛为百度创始团队成员、原集团副总裁,曾带领8000人团队,于2025年初加入曦望负责产品化和商业化 [4] - 团队规模约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验 [4] - 同时具备芯片工程能力与大规模业务经验的团队结构,在强调“稳定交付与成本控制”的推理GPU赛道中十分稀缺 [4] 技术路径与产品矩阵 - 曦望选择差异化路径,围绕推理场景的成本与效率对芯片架构进行“重写”,而非在通用GPU参数上追赶 [6] - 公司在调度、缓存、片上SRAM、互联及编译器路径上进行推理场景原生优化,并结合LPDDR内存技术以降低单位Token推理成本 [6] - 公司采取全栈自研,覆盖指令集、GPGPU IP及编译工具链等关键环节,已累计持有200余项核心专利,并实现“一次流片成功” [6] - 过去数年研发投入累计20亿元,已形成三代芯片产品矩阵 [6] - 2020年量产的S1芯片为国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [6] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型 [6] - 2026年即将推出的S3芯片定位为“推理性价比之王”,在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [6] 商业模式与市场定位 - 公司定位为AI产业的“损益表优化师”,其竞争不是“又一个芯片”,而是“重写中国AI产业的损益表” [8] - 公司认为推理能效、SLA稳定性与Token成本是决定业务毛利率与用户体验的核心指标 [8] - 公司选择不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,成为现有算力系统的“推理分流与成本优化层” [8] - 公司通过与本土芯片厂商合作为客户构建推理加速专区,形成独特的竞争生态 [8] - 公司的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力 [9] 行业影响与未来展望 - 曦望的崛起标志着国产AI芯片正从“跟跑”转向“差异化领跑” [9] - 随着AI推理红利的全面释放,当推理成为AI产业盈利的核心抓手,专注于降低推理成本的公司或将重塑中国AI基础设施的产业格局 [9]
封测涨价30%,国产算力产业链持续看好
东方财富证券· 2026-01-21 17:47
行业投资评级 - 强于大市(维持) [2] 核心观点 - AI推理主导创新,看好推理需求导向的Opex相关方向,主要为:存储、电力、ASIC、超节点 [2][30] - 从供给侧看,国内先进制程良率与产能爬升,推动国产算力芯片供给侧将有较大幅度改善;从需求侧看,国内CSP厂商商业化模式逐渐明朗,AI相关资本开支持续向上,同时国内模型也在持续迭代,有望带动国产算力在训练侧的放量需求,建议重点关注国产算力产业链的整体机会 [7][31] - 端侧:豆包AI手机开售,看好2026年端侧产品迭代 [7][32] 行情回顾总结 - **市场表现**:本周(2026年1月12日至1月16日)申万电子指数上涨3.77%,在31个申万行业中涨幅排名第2;2026年年初至今,申万电子指数上涨11.8%,排名5/31 [1][13] - **主要指数**:本周沪深300指数下跌0.57%,上证指数下跌0.45%,深证成指上涨1.14%,创业板指上涨1% [1][13] - **个股表现**:本周申万电子行业上市公司中有353家上涨,121家下跌;涨幅前五为蓝箭电子(57.66%)、佰维存储(45.85%)、汉朔科技(29.78%)、江波龙(27.36%)、凯德石英(26.14%) [18][21] - **估值水平**:截至2026年1月16日,电子行业估值水平(PE-TTM)为66.98倍,处于历史中部水平 [19] 本周关注总结 - **台积电利润大增**:台积电公布第四季度财报,净利润约合人民币1116.16亿元,同比增长35.0%,超出预期;公司预计2026年资本支出为520亿美元至560亿美元,而2025年资本支出总计409亿美元 [23] - **封测厂商报价大涨**:封测厂商报价大涨30%;产能紧张原因包括上游晶圆厂资源向HBM等先进封装倾斜导致标准型存储芯片供给吃紧,以及云端和工控市场需求回暖带动DDR4、DDR5和NAND芯片出货需求强劲 [23][24][26] - **成本上涨压力**:黄金、白银、铜等金属材料价格大幅上涨,增加了封装成本;例如,铜价上涨已迫使全球四大导线架厂商宣布从2026年元旦起涨价15%—30% [27][28] - **国内封测厂毛利率**:长电科技2025年前三季度毛利率为13.74%,通富微电为15.26%,华天科技为12.34%;长电科技表示已从下半年起逐步落地金价联动机制,三季度公司毛利率同比提升2个百分点 [28][29] 细分领域投资机会总结 - **存储**:随着长江存储新产品和长鑫的HBM3等最新产品逐渐突破,叠加数据中心对于SSD及HBM需求快速提升导致供需错配,激发扩产动能;判断今年有望是两存扩产大年 [2][30] - **电力**:看好电力产业链产品,重点关注用电侧和发电侧的新技术 [2][31] - **ASIC**:看好ASIC推理全栈模式,预期未来ASIC份额提升,关注国内外主要CSP厂商 [2][31] - **超节点**:预计未来机柜模式会迭代,看好高速互联、机柜代工、液冷散热、PCB等需求增长 [2][31] - **国产算力产业链**:建议重点关注国产算力产业链的整体机会,包括先进工艺制造、国产算力龙头、先进封装、先进设备等 [31] - **端侧AI**:看好2026年端侧产品迭代,涉及果链、SOC、AI眼镜等领域 [32] 相关公司列举总结 - **存储产业链**:中微公司、拓荆科技、安集科技、京仪装备、中科飞测、微导纳米、北方华创、兆易创新、精智达、汇成股份、美光、海力士、三星、闪迪、聚辰股份 [6][30] - **电力产业链**:三环集团、中富电路、顺络电子、东方钽业、英诺赛科、华峰测控 [6][31] - **ASIC产业链**:博通集成、寒武纪、芯原股份、沪电股份、福晶科技 [6][31] - **超节点产业链**:澜起科技、万通发展、盛科通信、工业富联、中石科技、捷邦科技、生益科技、菲利华、东材科技、鼎泰高科、大族数控、芯碁微装 [2][6][7][31] - **国产算力产业链**:中芯国际(港股)、华虹半导体(港股)、燕东微、寒武纪、海光信息、芯原股份、通富微电、长电科技、甬矽电子、长川科技、金海通、北方华创、拓荆科技、微导纳米 [8][31] - **端侧产业链**:苹果、立讯精密、蓝思科技、瑞芯微、恒玄科技、晶晨股份、歌尔股份、水晶光电、中兴通讯、传音控股、豪威集团 [8][32]
科创芯片设计指数早盘大涨4%,科创芯片设计ETF易方达(589030)助力一键打包国产芯片龙头
每日经济新闻· 2026-01-21 12:46
市场表现 - 1月21日早盘,国产芯片产业链股票上涨,CPU、存储芯片、先进封装概念表现活跃 [1] - 截至午间收盘,上证科创板芯片设计主题指数上涨4.2% [1] - 权重股中,龙芯中科20%涨停,海光信息涨超12%,澜起科技涨超7% [1] 上涨驱动因素 - 相关板块走强受益于海外高端CPU涨价趋势 [1] - 机构KeyBanc表示,Intel和AMD已售出2026年大部分服务器CPU产能,两家巨头都计划在一季度提价10%-15% [1] - 需求端:AI推理规模扩大使CPU成为关键瓶颈,特别是在AI Agent应用中,每次用户请求会触发多次模型调用和数据处理,大幅提升了CPU在控制面和数据面中的重要性 [1] - 供给端:先进制程与先进封装等关键资源扩张慢,加之GPU等芯片产能挤压,进一步强化了CPU厂商的议价能力 [1] 国内产业链机遇 - CPU涨价潮背景下,国内芯片产业链有望迎来发展机遇 [2] - 上证科创板芯片设计主题指数由科创板内不超过50只业务涉及芯片设计领域的股票组成 [2] - 该指数中,数字芯片设计行业占比超75%,模拟芯片设计行业占比约20% [2] - 指数前五大权重股为海光信息、澜起科技、寒武纪、芯原股份、东芯股份 [2] - 科创芯片设计ETF易方达(589030)跟踪该指数,可助力投资者一键布局国产芯片龙头 [2]
未知机构:美股存储继续强势创新高以存代算大趋势0121推理时代存储是-20260121
未知机构· 2026-01-21 09:55
纪要涉及的行业或公司 * **行业**:半导体存储行业、人工智能(AI)推理与计算基础设施行业[1] * **公司**: * **存储原厂**:美光、海力士、三星[2] * **存储模组/相关**:闪迪、香农芯创、开普云、德明利[2] * **芯片**:帝科股份[2] * **CPU**:海光信息、禾盛新材[2] * **设备、封测及材料**:雅克科技、佰维存储、长电科技、华源控股[2] 核心观点和论据 * **核心趋势**:AI发展进入“推理时代”,存储(存力)成为核心瓶颈与关键竞争领域,“以存代算”成为大趋势[1] * **核心论点一**:在AI推理应用商业化落地阶段,存储性能直接决定AI应用的效率和结果[1] * **核心论点二**:AI Agent等应用的发展,对长上下文记忆能力提出更高要求,导致Kv cache(键值缓存)随上下文数据量线性增长,进一步加剧对存储的需求[1] * **核心论点三**:当前依赖GPU和HBM(高带宽内存)的架构在处理复杂任务时存在能力和效率限制,结构化内存及基于CXL(Compute Express Link)技术的内存池化成为必要选择[1] * **市场表现**:美股存储板块持续走强并创下新高,反映了市场对“以存代算”趋势的认可[1] * **产业动态**:海外科技公司正大力投资存储,其信心和决心明确,表明行业正深度参与AI推理基础设施的构建[1] 其他重要内容 * **投资关注方向**:纪要列出了从存储原厂、模组、芯片到CPU、设备封测等全产业链的多个关注标的[2] * **具体公司信息**:提及帝科股份2023年第四季度利润超出市场预期,并与CXL技术相关联[2]
西部证券:供需失衡驱动服务器CPU价格上涨 AI推理推升行业需求
智通财经网· 2026-01-20 16:03
服务器CPU市场动态与价格趋势 - 英特尔与AMD计划将服务器CPU价格上调10%-15%,以应对供需失衡并确保后续供应稳定 [1][2] - 2026年英特尔与AMD的服务器CPU产能已基本预售完毕 [2] - 数据中心服务器CPU需求增加导致供需关系不平衡,从而推动价格上升 [3] 通用服务器市场复苏与需求驱动 - 全球服务器出货量有望实现超9%的同比增长,受数据中心架构升级及存量服务器CPU替换影响 [1][3] - AMD第五代EPYC"Turin"和英特尔Xeon"Granite Rapids"等新一代CPU产品性能有较大幅度提升 [3] - 云厂商前期采购的通用服务器已大面积进入更新周期,并推进架构升级,驱动补偿性投资 [3] AI发展对服务器市场的影响 - 生成式AI浪潮演进,AI服务器采购额上升,部分挤占了通用服务器的采购预算 [1][3] - 为应对AI推理算力需求增加,云厂商有望持续扩张资本开支 [4] - 2026年全球AI服务器出货量或将同比增长超20%,占服务器整体出货量比重有望上升至17% [4] 国产服务器CPU发展现状 - 海光信息的海光四号CPU、龙芯中科的3C6000、中国长城的飞腾S2500等国产CPU已在政务、金融、运营商等领域实现出货 [5] - 国产服务器CPU性能不断提升,软件兼容性持续改善,在通用服务器、存储服务器等场景加速落地 [5][6]