AI推理
搜索文档
苹果携手博通研发AI服务器芯片Baltra,2027年投入使用
新浪科技· 2025-12-16 11:35
【#曝苹果携手博通自研AI服务器芯片#】科技媒体 Wccftech 昨日(12 月 15 日)发布博文,报道称苹 果正在深化其"垂直整合"战略,不仅在消费电子端发力,更将触角伸向了核心算力基础设施,加速研发 代号为"Baltra"的首款自研 AI 服务器芯片。 据分析,苹果与博通将重点优化芯片的 INT8(8 位整数)等低精度数学运算能力,这不仅能大幅降低 能耗,还能显著提升用户端的响应速度。此外,供应链消息指出,该芯片极有可能采用台积电先进的 3nm"N3E"工艺,设计工作预计在未来 12 个月内完成。(IT之家) 消息称苹果已启动该自研项目,并选择博通(Broadcom)作为关键合作伙伴,负责攻克核心网络传输 技术,预计要等到 2027 年才能正式投入使用,被视为苹果摆脱对英伟达芯片依赖的关键一步。 "Baltra"芯片在设计理念上并未盲目追求全能,而是精准锁定了"AI 推理"(Inference)这一细分赛道。 苹果目前并不打算亲自下场训练超大规模 AI 模型,而是选择以每年 10 亿美元的代价,租用谷歌拥有 3 万亿参数的定制版 Gemini 模型来驱动云端"Apple Intelligence"服务 ...
摩根大通2026年存储市场展望:今年巨头市值逼近1万亿美元,2027年1.5万亿美元
美股IPO· 2025-12-15 15:15
行业周期与市场展望 - 摩根大通预计当前存储芯片行业将迎来历史上最长、最强劲的上升周期 [5] - 头部存储芯片制造商的总市值已接近1万亿美元,预计到2027年将飙升至1.5万亿美元,意味着仍有超过50%的上涨空间 [1][3][7] - 基于“市值/市场规模”估值框架,预测2027年存储市场规模将达到约4200亿美元,取历史市销率中值3.5倍计算,支撑1.5万亿美元市值预期 [6] 供需分析与短缺预测 - 市场担忧2027年新产能将导致DRAM供过于求,但摩根大通模型显示这种担忧是多余的,未来两年DRAM位元供应增长仍将落后于需求增长 [5] - 尽管2027年供需缺口可能从2026年的5%缩小至3%,但市场仍将处于短缺状态 [9] - 强劲的云服务提供商需求迫使厂商将更多产能分配给HBM,HBM占DRAM总产能的比例将从2025年的19%大幅攀升至2027年的28% [10] - 2026年常规DRAM产能预计同比下降,2027年新产能上线也受限于物理条件,DRAM位元出货量增长将被限制在20%以下 [11] 价格趋势与市场结构 - 市场正经历“双轨制”定价:企业级/AI需求强劲支撑价格高位,消费级则面临周期性压力,但服务器端需求上行将完全抵消消费端下行风险 [5] - 预测2026财年DRAM平均售价将暴涨53%,NAND平均售价上涨约30% [15] - 预计2027财年DRAM平均售价仍将微涨1%,NAND平均售价可能小幅回调6% [15] - 从2026年下半年到2027年上半年,AI推理需求将支撑B2B端价格坚挺,而B2C端将因客户抵触高价面临价格下行 [13][14] AI驱动的结构性机遇 - AI推理对内存的消耗是训练的3倍,形成结构性需求 [1][5] - HBM供需短缺(约8%-12%的缺口)预计将贯穿2027年,甚至可能延续至2028年 [19] - Google下一代2nm TPU可能采用HBM4,加上Rubin Pro GPU带来的4倍容量增长,将持续挤压供应链 [18] - AI服务器对SSD的搭载量是普通服务器的3倍,企业级SSD需求巨大,预计将推动2026财年NAND价格上涨27% [23] 资本开支与供应纪律 - 尽管存储厂商宣布产能扩张,但实际产生的位元供应增长将被物理迁移挑战所抵消 [25] - 预计存储晶圆厂设备的增长将大幅领先于总体资本开支的增长(2026/2027年DRAM晶圆厂设备支出分别增长19%/26%) [26] - 无论是DRAM(低于30%)还是NAND(低于20%),隐含的资本密集度都将低于过去五年的平均水平,显示供应端保持显著纪律性 [27]
软件ETF(515230)近20日净流入超1.4亿元,关注英伟达存储变革下软件重构
每日经济新闻· 2025-12-15 15:07
AI计算架构变革 - AI推理需求具有小数据块、高并发和大存储容量的特点,现有以CPU为中心的传统架构难以满足需求[1] - 提出将控制和数据路径移至GPU,通过GPU直接连接SSD来提高存储量和传输速率,并利用SCADA软件架构控制存储I/O[1] - 底层硬件变革将带动软件重构,形成以GPU为中心的新架构[1] 技术发展进程与产业机遇 - 预计2027年初将推出首款搭载HBF技术的AI推理系统[1] - Hammerspace和CloudianHyperStore已开始优化软件性能[1] - 数据库产业有望因GPU直连SSD架构的创新迎来新的发展机遇[1] 软件行业指数概况 - 软件ETF(515230)跟踪的是软件指数(H30202)[1] - 该指数从市场中选取涉及软件开发、销售和服务等业务的上市公司证券作为指数样本[1] - 指数覆盖操作系统、应用软件、网络安全等领域的代表性企业,以反映软件行业相关上市公司证券的整体表现[1] - 该指数具有显著的成长性和技术导向性,能够较好地体现软件行业的市场趋势和发展动态[1]
摩根大通2026年存储市场展望:今年巨头市值逼近1万亿美元,2027年1.5万亿美元
搜狐财经· 2025-12-15 14:16
摩根大通在最新研报中指出,当前头部存储芯片制造商的总市值已接近1万亿美元。基于历史估值中枢推算,到2027年这一数字将飙升至1.5万亿美元, 意味着头部厂商仍有超过50%的上涨空间。 据追风交易台,12月14日,摩根大通在最新报告中称,当前的周期将是历史上最长、最强劲的存储上升周期。 摩根大通给出的答案非常明确:继续做多。 基于"市值/市场规模(TAM)"的估值框架,摩根大通预测2027年存储市场规模将达到约4200亿美元。取2018年和2021年周期的市销率(P/S)中值3.5倍 计算,头部存储及内存制造商的合计市值有望在2027年逼近1.5万亿美元。 这意味着从当前水平看,头部玩家仍有超过50%的市场上限空间。 供需真相:2027年依然短缺 目前市场上最大的空头论点是:2027年的新建晶圆厂投放和加速的技术迁移将引发DRAM供过于求。 摩根大通通过自下而上的"产能-位元"分析模型驳斥了这一观点: 投资者普遍担忧2027年新产能会导致DRAM供过于求。摩根大通的数据模型显示这种担忧是多余的——HBM的产能挤占和AI推理的结构性需求(推理 对内存的消耗是训练的3倍)将导致未来两年DRAM位元供应增长仍将落后于 ...
海内外CSP资本开支创新高,数字经济ETF(560800)整固蓄势,机构:国产化迎结构性机会
搜狐财经· 2025-12-15 10:09
市场表现与指数动态 - 截至2025年12月15日09:48,中证数字经济主题指数下跌0.71% [1] - 指数成分股中,中微公司领涨,北方华创、华润微跟涨;纳思达领跌,澜起科技、拓荆科技跟跌 [1] - 数字经济ETF(560800)进行下修调整 [1] 行业趋势与资本开支 - 全球AI推理需求快速增长,驱动海外云服务提供商(CSP)进一步加大算力基础设施投入,AI推理相关资本开支持续上行 [1] - 2025年第三季度,海外四大CSP的资本开支合计979亿美元,环比增长10%,延续季度上升趋势 [1] - 国内整体算力资本开支仍处于追赶阶段,与海外巨头在投入总量上存在差距 [1] - 从Token调用量与业务规模看,字节等国内头部厂商已接近谷歌体量 [1] 国产半导体与电子行业 - 国产GPU企业在技术积累和生态构建方面与国际领先企业仍有差距,但已实现单芯片支持AI计算、图形渲染等技术突破 [2] - 当前电子行业需求持续复苏,供给有效出清,国产化力度超预期 [2] - 半导体设备、关键零部件和存储涨价等环节存在结构性机会 [2] 指数与ETF产品信息 - 数字经济ETF紧密跟踪中证数字经济主题指数,该指数选取涉及数字经济基础设施和数字化程度较高的应用领域上市公司证券作为样本 [2] - 截至2025年11月28日,中证数字经济主题指数前十大权重股合计占比54.6% [2] - 前十大权重股包括东方财富(权重8.64%)、寒武纪(6.98%)、中芯国际(7.17%)、海光信息(5.91%)、北方华创(5.02%)、中科曙光(4.44%)、澜起科技(4.53%)、兆易创新(3.62%)、汇川技术(4.04%)、中微公司(3.39%) [2][3] 成分股具体表现 - 在提供的数据中,北方华创上涨1.65%,中微公司上涨2.00%,寒武纪上涨0.90% [3] - 海光信息下跌2.00%,澜起科技下跌2.79%,中科曙光下跌1.82%,兆易创新下跌1.74%,中芯国际下跌1.18%,汇川技术下跌1.03%,东方财富下跌0.61% [3]
机构看好国产算力业绩释放,芯片ETF(159995.SZ)上涨1.72%,拓荆科技上涨9.37%
每日经济新闻· 2025-12-12 14:06
市场表现 - 12月12日下午A股三大指数集体上涨,上证指数盘中上涨0.17% [1] - 电子、通信、国防军工等板块涨幅靠前,综合、商贸零售板块跌幅居前 [1] - 芯片科技股走强,截至13点04分,芯片ETF(159995.SZ)上涨1.72% [1] - 芯片ETF成分股中,拓荆科技上涨9.37%,龙芯中科上涨6.42%,北京君正上涨5.63%,豪威集团上涨4.48%,中微公司上涨4.02% [1] 行业趋势与资本开支 - 全球AI推理需求快速增长,驱动海外云服务提供商(CSP)进一步加大算力基础设施投入,AI推理相关资本开支持续上行 [3] - 2025年第三季度,海外四大CSP的资本开支合计979亿美元,环比增长10%,延续了季度间上升的趋势 [3] - 国内整体算力资本开支仍处于追赶阶段,与海外巨头在投入总量上仍存在一定差距 [3] - 从Token调用量与业务规模来看,字节等国内头部厂商已接近谷歌体量 [3] 国产算力产业链前景 - 国产先进制程扩产稳步推进,叠加产业链自主可控进展加速,将显著增强国内算力产业的供给保障能力 [3] - 在AI推理和训练需求持续提升的背景下,国产算力厂商有望充分受益,业绩释放可期 [3]
电子行业周报:AI推理+国产化双主线,持续关注端侧变化-20251210
东方财富证券· 2025-12-10 21:48
报告行业投资评级 - 强于大市(维持)[2] 报告的核心观点 - 报告核心观点为AI推理与国产化是行业两大投资主线,并持续关注端侧变化 [1] - 预期AI推理主导创新,看好推理需求导向的Opex相关方向,主要为存储、电力、ASIC和超节点 [2][25] - 国产化方向从供给侧和需求侧均有望改善,带动国产算力产业链机会 [5] - 看好2026年端侧产品迭代 [5] 根据相关目录分别进行总结 1. 本周行情回顾 - 本周市场整体上涨,电子行业表现好于市场整体 [1][10] - 本周沪深300指数上涨1.28%,上证指数上涨0.37%,深证成指上涨1.26%,创业板指上涨1.86% [1][10] - 申万电子指数本周上涨1.09%,在31个申万行业中涨幅排名第13 [1][10] - 年初以来,申万电子指数上涨42.15%,排名3/31 [1][10] - 细分板块层面,光学光电子、消费电子、半导体和电子化学品分别上涨4.42%、1.61%、0.88%和0.34%;元件和其他电子分别下跌0.67%和1.34% [15] - 个股层面,本周申万电子行业上市公司中有259家上涨、214家下跌 [16] - 涨幅前五的个股为骏亚科技(+33.73%)、睿能科技(+28.63%)、联建光电(+28.62%)、福蓉科技(+27.63%)、乾照光电(+25.22%) [16][19] - 跌幅前五的个股为昀冢科技(-20.19%)、东芯股份(-12.92%)、三孚新科(-12.37%)、香农芯创(-12.33%)、芯原股份(-11.03%) [16][19] - 截至2025/12/05,电子行业估值水平(PE-TTM)为57.74倍,处于历史中部水平 [20] 2. 本周关注 - **Q3半导体设备市场,中国大陆稳居榜首** [21] - 2025年第三季度,全球半导体设备出货量攀升至336.6亿美元,同比增长11% [21] - 2025年前三个季度半导体设备出货量已接近1000亿美元,创下历史新高 [21][22] - 第三季度半导体设备销售额排名中,中国大陆以145.6亿美元位居榜首,其次是中国台湾(82.1亿美元)、韩国(50.7亿美元)、北美(21.1亿美元)、日本(18.3亿美元) [22] - 增长由人工智能驱动的创新需求激增所推动,特别是对先进逻辑、DRAM和先进封装解决方案的投资 [22] - ASML连续第三年蝉联2025年全球第一大半导体设备公司 [22] - ASML第三季度实现净销售额75亿欧元,毛利率达51.6%,净利润21亿欧元,新增订单金额54亿欧元(其中EUV光刻机订单36亿欧元) [22] - ASML预计2025年第四季度净销售额将达92亿至98亿欧元,全年净销售额同比增长约15% [22] - **Marvell拟砸数十亿美元,收购Celestial AI** [24] - 美国芯片制造商Marvell拟通过一笔价值数十亿美元的现金加股票交易收购芯片初创公司Celestial AI [24] - 总交易价格可能超过50亿美元 [24] - Marvell是一家市值785.4亿美元的网络芯片制造商 [24] - Celestial AI在3月份筹集了2.5亿美元风险投资,融资总额达到5.15亿美元,该公司利用光子学技术在AI计算芯片和存储芯片之间建立高速连接 [24][25] 3. 本周观点 - **存储** [2][26] - 随着长江存储新产品和长鑫的HBM3等最新产品逐渐突破,叠加数据中心对于SSD及HBM需求快速提升导致供需错配,激发长存及长鑫扩产动能 [2][26] - 判断明年有望是两存扩产大年,建议重点关注国产存力产业链的整体机会 [2][26] - 报告列出了NAND&DRAM半导体(长存相关)产业链、长鑫&HBM存储芯片相关产业链及存储原厂等相关公司 [4][26] - **电力** [4][27] - 看好电力产业链产品,重点关注用电侧和发电侧的新技术 [4][27] - 报告列出了发电侧和用电侧相关公司 [4][27] - **ASIC** [2][27] - 看好ASIC推理全栈模式,预期未来ASIC份额提升,关注国内外主要CSP厂商 [2][27] - 报告列出了ASIC芯片及配套相关公司 [4][27] - **超节点** [2][27] - 预计未来机柜模式会迭代,看好高速互联、机柜代工、液冷散热、PCB等需求增长 [2][27] - 报告列出了高速互联、机柜代工、液冷散热、PCB等相关公司 [2][4][5][27] - **国产化方向** [5][27] - 从供给侧看,国内先进制程良率&产能爬升,推动国产算力芯片供给侧将有较大幅度改善 [5][27] - 从需求侧看,国内CSP厂商商业化模式逐渐明朗,AI相关资本开支持续向上,同时国内模型也在持续迭代,有望带动国产算力在训练侧的放量需求 [5][27] - 建议重点关注国产算力产业链的整体机会,并列出先进工艺制造、国产算力龙头、先进封装、先进设备等相关公司 [5][27] - **端侧** [5][28] - 豆包AI手机开售,看好26年端侧产品迭代 [5][28] - 报告列出了果链、SOC、AI眼镜及其他相关公司 [5][28]
谷歌TPU杀疯了,产能暴涨120%、性能4倍吊打,英伟达还坐得稳吗?
机器之心· 2025-12-09 16:41
谷歌TPU产能与商业化战略 - 摩根士丹利大幅上调谷歌TPU产量预测,预计2027年达500万块,2028年达700万块,较此前预测分别上调67%和120% [2] - 未来两年(2027-2028)谷歌计划生产1200万块TPU,而过去四年总产量仅为790万块 [2] - 摩根士丹利测算,谷歌每销售50万块TPU芯片,2027年可贡献约130亿美元收入,并增加每股收益0.40美元 [2] - 谷歌战略包括直接向第三方数据中心销售TPU,作为谷歌云平台业务的重要补充,为广泛商业化做准备 [2] AI算力市场格局演变:从训练到推理 - 到2030年,推理将消耗75%的AI计算资源,形成一个规模达2550亿美元、年复合增长率19.2%的市场 [8] - 分析师估计,到2026年,推理需求将比训练需求高出118倍,并将推动7万亿美元的基础设施投资 [14] - 训练是一次性高成本投入,例如GPT-4训练成本为1.5亿美元,而推理是持续成本,例如OpenAI 2024年推理支出预计达23亿美元,是GPT-4训练成本的15倍 [13][14] - 市场格局正从模型训练(英伟达强项)向模型推理(实时应用)重塑 [8] 谷歌TPU与英伟达GPU的技术与成本对比 - 在大型语言模型等推理任务上,TPU的性价比是英伟达H100 GPU的4倍 [17] - 谷歌最新的Ironwood (v7) TPU速度是v6的4倍,峰值计算能力是v5p的10倍,每代产品带来2-3倍的性价比提升 [17] - TPU能效更高,执行搜索查询时比GPU节能60-65%,在MLPerf基准测试9个推理类别中赢得8个 [17] - TPU v6e按需使用起价为每小时1.375美元,长期合约可降至每小时0.55美元,且无需支付英伟达授权费,而H100成本为每小时2.50美元以上 [17][21] ASIC与GPU的架构差异及竞争态势 - GPU是通用处理器,灵活性高;ASIC是专用集成电路,为单一任务(如张量运算)设计,牺牲灵活性以换取极高效率 [27] - ASIC在能效、延迟、每次操作成本和可扩展性方面具有优势,TPU通过硬件固定操作,相同工作负载下能耗降低60-65% [28] - 未来计算策略预计是混合部署:GPU用于研究和训练,ASIC用于生产推理 [30] - 谷歌云高管预计,仅TPU的采用就可能影响英伟达10%的收入,并对英伟达70-80%的高毛利率构成价格压力 [22] 行业巨头向TPU迁移的案例 - 图像生成公司Midjourney在2024年转向TPU后,推理成本降低65%,从每月200万美元降至70万美元 [34] - Anthropic与谷歌达成价值数百亿美元的交易,承诺使用多达100万个TPU,预计到2026年释放超过1GW计算容量 [35] - Meta作为英伟达最大客户(计划2025年支出720亿美元),正就价值数十亿美元的TPU部署进行深入洽谈,计划从2026年开始通过谷歌云租赁TPU,并在2027年前部署本地TPU [36] - Salesforce和Cohere使用TPU后实现了3倍的吞吐量增长 [36] TPU与GPU的选择决策框架 - 选择TPU的场景:推理成本超过每月5万美元、工作负载为大规模LLM服务或推荐系统、部署于谷歌云平台、重视能源效率、具有可预测的扩展需求 [41][42][43] - 选择英伟达GPU的场景:需要训练灵活性及CUDA生态系统、实施多云战略避免供应商锁定、运行多样化非AI工作负载、每月AI计算预算低于2万美元、尝试尚未针对TPU优化的前沿模型架构 [44][45][46][47][48] - 混合战略建议:部署英伟达H100用于训练和模型开发,使用TPU v6e/v7进行生产推理服务,可节省40-50%的总计算资源 [49] - 大规模TPU迁移通常需要2-6个月,投资回报期约为3-4个月 [49] 市场影响与投资者行为 - 部分精英投资者抛售英伟达股票,例如彼得·蒂尔的对冲基金在2025年第三季度清仓价值约1亿美元的英伟达股票,日本软银清仓3210万股套现58.3亿美元 [65][66] - 投资者担忧包括:GPU供应过剩和资产贬值(每年价值下降30-40%)、TPU竞争导致英伟达利润率压缩、客户多元化投资减少对英伟达收入依赖 [67] - 尽管面临挑战,英伟达仍控制着超过80%的AI芯片市场,其2023年数据中心业务收入达600亿美元 [13][67] TPU面临的挑战与未来竞争 - TPU生态系统与TensorFlow/JAX绑定,灵活性不及英伟达CUDA,本地部署市场处于起步阶段 [69] - 扩展TPU至4096个芯片需要谷歌云投入,混合架构将持续存在 [69] - 新兴竞争者包括亚马逊的Trainium、微软的Maia芯片,但它们在成熟度(TPU已发展至第九代)和规模上尚无法与TPU相比 [69] - 谷歌与博通和台积电合作加速v7芯片生产,预计到2026年第二季度TPU供应将能满足需求 [69] 其他关键问答摘要 - 英伟达即将发布的Blackwell架构承诺提升推理效率,但早期分析表明TPU在大规模纯推理方面仍保持2-3倍的成本优势 [74] - AMD的MI300和英特尔的Gaudi芯片是GPU替代方案,可节省30-40%成本,但效率仍不及TPU [77] - TPU在标准架构上表现出色,对于自定义AI模型,建议先在GPU上原型设计,待架构稳定后再针对TPU优化生产模型 [76]
资产配置周报告|大金融发力,反攻节点出现!
新浪财经· 2025-12-08 20:27
全市场估值与表现概览 - 截至数据统计日,全球主要指数估值分化显著,标普500市盈率(PE)为32.11倍,处于历史97.87%的高分位,而恒生指数PE为12.04倍,处于历史54.86%分位,显示港股估值相对较低 [1][39] - 从年度表现看,创业板50指数年涨幅达53.40%,领跑主要宽基指数,北证50年涨幅为35.70%,科创50年涨幅为34.09%,显示科技成长风格表现强劲 [1][39] - 市场风格监控显示,上周资金偏好大盘股,沪深300周涨幅1.28%,表现优于中证500的0.94%、上证50的1.09%及中证1000的0.11% [7][45] - 同花顺全A股债利差为2.52%,位于历史前50%的高利差区域,当前市盈率(PE)为22.92倍,10年期国债收益率为1.85%,显示股票资产具备相对配置价值 [4][42] A股市场回顾与展望 - 上周A股市场呈现“大金融发力,反攻节点出现”的特征,指数放量重回3900点上方,航天、福建板块、AI手机、贵金属等主题持续活跃 [1][39] - 板块轮动加快,航天、福建等板块走出持续性行情,其余板块以轮动为主,伴随周五市场重新放量反攻,短期补跌风险暂时解除 [2][40] - 操作策略上,短期建议关注“十五五”规划提及的可控核聚变、量子科技、商业航天等方向,中期多头趋势未变,逢调整是布局时机 [2][40] 港股市场展望 - 港股市场短期维持箱体震荡格局,日线级别在26000点附近形成有效支撑,短期反弹有望持续,上方缺口存在回补预期 [9][47] - 伴随近期利好政策催化,市场情绪有望稳步回升,中期多头趋势不变,市场有望回归慢牛格局 [9][47] - 在市场量能提升背景下,消费电子、大科技、AI等相对景气板块存在结构性机会,上攻阶段若遇调整,公用事业等防守类板块可能迎来资金回流 [9][47] 债券市场分析 - 国内利率债近期维持窄幅震荡,1年、5年、10年期国债收益率分别为1.40%、1.63%、1.85%,其中10年期收益率较前一日下降2.38个基点(BP) [11][49][52] - 央行此前表述十年期国债收益率运行区间为1.75%-1.85%,本周屡次尝试突破1.85%后回落,预计短期内仍将在此区间运行 [11][49] - 进入12月中期,需关注美联储议息会议及中央经济工作会议等国内外重磅会议可能给债市带来的波动影响 [11][49] 行业表现与机会解析 - 上周行业涨幅前三为:有色金属(周涨4.31%)、石油石化(周涨3.35%)、国防军工(周涨3.40%);跌幅前三为:媒体娱乐(周跌-3.68%)、家庭用品(周跌-2.58%)、房地产(周跌-2.19%) [14][52] - 行业逻辑解析指出,短期看好海洋经济与固态电池方向,中期看好算力与人形机器人方向 [15][53] 海洋经济产业分析 - 2025年政府工作报告首次在新质生产力部分提及“深海科技”,将其与商业航天、低空经济并列,有望获得高速发展,尤其是在深海装备、深海探索等核心科技领域 [16][54] - 在“海洋强国”战略驱动下,以蓝色债券为代表的创新型金融工具正成为推动海洋经济高质量发展的重要抓手,有望引导资本向海上风电、海水淡化等绿色产业聚集 [19][57] - 海洋经济产业链长,可分为基础设施层(海港与服务)、装备技术层(作业船和海运)、资源开发层(海水淡化、海鲜产品)三个层级,其中装备与制造环节或将最先受益于深海科技建设 [19][57] 固态电池产业分析 - 固态电池使用固体电解质替代传统锂电池的电解液和隔膜,全固态电池能量密度可达500Wh/kg以上,大幅高于主流液态锂电池的150-300Wh/kg [21][23][59][61] - 政策持续加码支持,自2020年《新能源汽车产业发展规划》首次将固态电池研发列为重点,到2023年《关于推动能源电子产业发展的指导意见》强调加强其产业化技术攻关与标准体系研究 [24][62][63] - 产业化进程加速,上汽MG4车型将于8月5日亮相并全球首次量产搭载半固态电池,起售价预计低于9万元,标志着固态电池市场正式迈入量产阶段 [28][66] - 市场空间广阔,EVTank预计固态电池将在2025年开始放量,到2030年全球出货量有望达614.1GWh,在锂电池中渗透率约10%,市场规模将超过2500亿元 [28][66] AI算力产业分析 - 阿里发布自主研发的磐久128超节点AI服务器,实现单柜128颗AI芯片的业界最高密度,采用开放架构,同等算力下推理性能较传统架构提升50% [30][68] - 摩尔线程IPO过会,公司为国内极少数兼顾图形渲染与AI计算的全功能GPU公司,拟募资80亿元用于新一代AI训推一体芯片、图形芯片等研发项目 [31][69] - AI推理需求爆发,英伟达CEO提出“思考”推理定律,认为推理能力将呈指数级增长,带动AI算力硬件需求持续强劲,国产算力硬件有望迎来爆发式增长 [31][69] 人形机器人产业分析 - 宇树科技IPO辅导于2025年11月29日完成,标志着中国人形机器人产业从“研发投入期”向“规模化落地期”转型,若成功上市将成为“A股人形机器人第一股” [32][70] - 市场潜力巨大,根据中国信息通信研究院数据,预计国内人形机器人需求将超过1亿台,整机市场规模可达10万亿元级别 [32][70] - GGII预计2024年全球人形机器人销量为11,867台,至2030年有望达605,680台,年复合增长率(GAGR)为92.60% [33][71] - 人形机器人对上游零部件需求巨大,以特斯拉Optimus为例,其40个关节驱动装置需要大量减速器、滚珠丝杠、力传感器和驱动电机,为国产供应链公司带来发展机遇 [35][73][76]
计算机行业跟踪周报:构建数据库的“CUDA”,英伟达存储变革下软件重构-20251207
东吴证券· 2025-12-07 16:46
报告行业投资评级 - 增持(维持)[1] 报告的核心观点 - 随着AI推理时代的到来,传统的以CPU为中心的存储与计算架构已成为瓶颈,行业正经历从“以CPU为中心”到“以GPU为中心”的根本性变革[4][9] - 为满足AI推理“小块高频”的极致I/O需求,硬件上出现GPU直连SSD的新架构,软件上则需要重构以GPU为核心的数据库(GPU-Native数据库),这将为数据库产业带来新的机遇[4][18][25] 根据相关目录分别进行总结 1. AI推理时代来临,GPU直连SSD存储新架构出现 - AI推理与训练对存储的需求差异巨大:训练需要大数据块(10MB-1GB)、少并发、总容量相对较低(1-10TB);而推理需要小数据块(低至8B、64B、512B)、高并发(数千条)、大存储容量(高达1PB或数百TB)[4][9][10] - AI工作负载分化推动存储评估指标从传统的“每TB成本”(TB/TCO)转向“每IOPS成本”(IOPS/TCO),推理和预测式AI的性能瓶颈在于处理海量、高并发、小I/O请求的能力(IOPS)[9][10] - 传统以CPU为中心的架构无法满足AI推理的高并发需求,成为瓶颈,需要提升GPU地位,使其成为数据访问的控制中心,实现从CPU“推送”数据到GPU“拉取”数据的转变[4][11][14] - 解决方案是通过GPU直连SSD硬件(如通过NVMe-of、RDMA、GPUDirect Storage等技术)和SCADA软件架构,让GPU绕过CPU直接、高效地从SSD读写数据,彻底旁路CPU在数据流中的角色[4][14][16] 2. 存储架构变化带来数据库架构的变化 - 架构层面发生根本变化:从“以CPU为中心”转向“以GPU为中心”,GPU成为主计算单元,CPU角色退化为任务调度器、事务协调器和元数据管理器[4][18] - 数据库核心组件需要升级改造:1) 存储引擎革新,新的缓存管理器需直接管理GPU显存和直连SSD间的数据流动;2) 数据布局优化,为匹配GPU的SIMD架构,可能采用纯列式或混合存储格式并原生支持Apache Arrow等零拷贝格式;3) 查询执行引擎重构,核心算子需深度重写为GPU内核并能直接从SSD流式消费数据,实现计算与I/O的完全重叠[4][19][21] - 查询优化器面临挑战,成本模型需纳入GPU计算核心占用率、HBM与SSD间带宽、PCIe传输延迟等新因素,并优先考虑数据本地性优化[21] - GPU直连SSD技术将使得数据库从一个在通用操作系统上运行的应用程序,演变为一个直接调度和管理GPU、SSD的“数据中心级操作系统内核”[4][21] 3. 产业进展逐步加快 - 硬件方面:1) 2025年8月,闪迪与SK海力士签署谅解备忘录,共同制定高带宽闪存(HBF)技术规范,目标在2026下半年发布HBF样品,首批搭载HBF的AI推理系统预计于2027年初面世[4][21][22];2) 2025年9月,铠侠宣布将与英伟达合作,开发可直接连接到GPU并进行数据交换的SSD,目标性能需达到2亿IOPS,并计划支持PCIe 7.0标准[4][22] - 软件方面:1) Hammerspace通过优化元数据读取和GPU服务器直连存储驱动器中的数据放置策略,加速了其数据编排平台软件的性能[4][23];2) Cloudian HyperStore通过RDMA over S3技术,实现对象存储与GPU内存的直接数据传输,使基于S3接口的向量数据库性能提升8倍[4][24] 4. 投资建议 - 投资逻辑基于AI推理爆发驱动GPU地位提升及硬件架构变革(GPU直连SSD),进而引发软件生态(尤其是数据库)的重大重构需求,数据库产业有望迎来新机遇[4][25] - 报告提及的相关标的包括:【星环科技】、达梦数据、海量数据、MongoDB、Snowflake等[4][26]