AI推理算力
搜索文档
机械设备行业点评报告:GTC大会召开,PCB、液冷环节确定性进一步提升
东吴证券· 2026-03-17 18:21
报告行业投资评级 - 增持(维持)[1] 报告核心观点 - 英伟达GTC大会召开,重点展示了Rubin系列架构、LPU机柜架构及正交背板方案,强化了AI算力建设需求,特别是推理侧的需求[1][2] - 大会新亮点LPU(语言处理单元)机柜架构是专为推理设计的ASIC,追求低延迟和高吞吐量,其架构显著增加了单机柜的PCB用量,并推动了PCB材料与层数的升级[2] - Rubin Ultra架构中的正交背板方案展示,增强了该技术路线的确定性,旨在用背板替代铜缆以实现更高的单机柜算力集成[3] - 所有展示的机架结构均采用液冷方案,液冷需求确定性得到强化[3] - 基于技术迭代,PCB设备与液冷赛道的发展确定性高,市场空间将持续扩容[4] 根据相关目录分别总结 英伟达GTC大会要点 - 大会于2026年3月17日召开,黄仁勋重申未来算力建设需求及推理侧的Token需求[1] - 重点展示产品路线:从Blackwell到Rubin再到Feynman的演进,以及Rubin系列、Rubin Ultra架构和Groq 3 LPU机柜架构[1] LPU(语言处理单元)架构分析 - LPU是专为AI推理设计的ASIC,核心是将大容量片上SRAM集成在芯片上以降低数据访问延迟,并采用确定性执行架构保证高吞吐量[2] - 单LPU服务器由32个托盘组成,单托盘集成8张LPU芯片,单机柜共包含256张LPU芯片[2] - 相比过往架构,单机柜托盘数量(等效PCB数量)显著提升,为PCB环节带来新增量[2] - LPU对信号传输要求提高,推动PCB向材料升级和层数提升的方向发展[2] 正交背板与其他增量环节 - Rubin Ultra架构展示了正交背板方案,通过背板连接计算刀片和交换刀片,在Scale up层面替代铜缆,提升单机柜算力集成[3] - 大会还展出了Vera CPU独立机柜和STX存储机柜,这些均会带来PCB增量需求[3] PCB环节发展 - PCB确定性与重要性提高,市场空间持续扩容[4] - 近期主要PCB厂商资本开支大幅增长:沪电股份公布总投资规划约100亿元;鹏鼎控股在泰国工厂追加43亿元投资;胜宏科技25Q4资本开支为29.63亿元,环比增长98%;深南电路25Q4资本开支为14.16亿元,环比增长76%[4] - 从报表端可追踪PCB资本开支斜率向上,看好设备端投资[4] 液冷环节发展 - 伴随服务器架构升级与功率密度提升,100%液冷逐渐成为必选项[4] - NV链与ASIC链均在积极筹备液冷系统供应体系,看好国产液冷系统供应商凭借性价比与配合度优势切入北美客户[4] 投资建议 - PCB设备重点推荐:大族数控、芯碁微装[5] - PCBA设备重点推荐:凯格精机[5] - PCB耗材重点推荐:中钨高新、鼎泰高科、新锐股份[5] - 建议关注:民爆光电[5] - 液冷重点推荐:英维克、宏盛股份[5] - 液冷建议关注:领益制造、申菱环境、高澜股份、鸿富瀚、冰轮环境、奕东电子、中石科技、同飞股份、捷邦科技、依米康、飞龙股份[5]
电子行业点评报告:OpenClaw热潮加速端侧Agent渗透,推理算力需求激增
开源证券· 2026-03-16 14:24
报告行业投资评级 - 投资评级:看好(维持)[1] 报告核心观点 - OpenClaw热潮标志着AI大模型从“对话时代”进入“智能体时代”,其本地优先、自主执行等特性更符合用户真实需求,获得国内头部厂商的密集跟进与产品发布[4] - Agent AI的应用导致Token消耗从线性增长跃升至指数级增长,从而驱动推理算力需求呈指数级增长[5] - OpenClaw推动端侧AI从“推理”转向“执行”,重构能力边界,并在PC、手机、穿戴设备等多端持续渗透,有望催生更多应用场景和终端品类[5] 根据相关目录分别进行总结 OpenClaw发展现状与影响 - OpenClaw是一个开源AI智能体框架,于2026年2月迎来爆发,登顶Github全球热榜[4] - 与其它Agent产品相比,OpenClaw具有本地优先、自主调用工具、跨应用执行、多IM接入与持续在线运行等能力,具备“数字员工”属性[4] - 自2026年2月至今,智谱、腾讯、华为、阿里、字节、Kimi、MiniMax、小米等国内头部厂商基于OpenClaw密集发布类Claw产品或方案,腾讯云、阿里云、火山引擎等云服务商也推出了OpenClaw部署服务[4] - 具体产品案例包括:智谱AutoClaw(国内首个“一键安装”本地版,内置Pony-Alpha-2模型,预置超50个技能)、腾讯WorkBuddy(深度兼容OpenClaw所有技能,无需云端部署)[4] Agent AI驱动的算力需求激增 - Agent AI具备机器自主调用、长上下文记忆、多工具链协同与多Agent并发等特点,其“计划—执行—反馈—再规划”的工作流使Token消耗呈指数级增长[5] - 以OpenClaw为例,一次任务动辄消耗数十万至百万级Token[5] - 数据显示,中国日均Token消耗量从2024年初的1000亿增长至2025年6月底的30万亿,1年半时间增长了300多倍[5] - 根据IDC预测,到2030年,全球活跃AI智能体将达22.16亿,年度Token消耗量将从2025年的0.0005 Peta Tokens飙升至15.2万 Peta Tokens,增长超3亿倍[5] 端侧AI的演进与厂商动态 - OpenClaw采用模块化架构,拥有完整的会话管理、记忆系统和“心跳”机制,可实现无人干预下自主操控软件、读写文件等功能,使AI从对话者转为“执行者”[5] - 手机、穿戴类产品厂商积极适配OpenClaw类智能体:小米miclaw(2026年3月6日开启封测,封装50多个系统工具)、华为小艺Claw(2026年3月11日披露处于Beta版,支持多端协同)、OpenClaw社区负责人宣布将开发基于Rokid Glasses的智能眼镜版本(2026年3月14日)[5] - OpenClaw推动端侧AI从“推理”转向“执行”,有望催生更多端侧AI应用场景和终端品类[5] 投资建议与关注方向 - 投资建议重点关注AI推理算力产业链(芯片/整机/液冷/电源等环节)和端侧AI产业链[6] - 推荐标的包括:海光信息、领益智造(立敏达)、东山精密、欧陆通、奥海科技、传音控股等[6] - 受益标的包括:寒武纪、智微智能(元川微)、禾盛新材(熠知电子)、工业富联、立讯精密、环旭电子、鸿日达、硕贝德、苏州天脉、天岳先进等[6]
AI发展驶入“回归商业本质”阶段,国产芯片迎“推理机遇”
新浪财经· 2026-02-27 07:52
文章核心观点 - 春节期间算力产业链新闻频发,OpenAI调整算力投资口径、Meta与英伟达达成大额芯片协议、Taalas芯片崛起等事件引发行业关注 [1] - OpenAI的调整并非预算削减或AI泡沫破灭的信号,而是产业发展进入更务实阶段,开始回归商业本质,更加关注营收利润 [1] - 北美云厂商资本开支持续增长,预计将维持算力及英伟达产业链的高景气度 [1] - AI应用加速落地将推动产业链对算力结构、AI大模型及商业模式的需求发生变化,AI推理算力与国产AI芯片的投资机遇值得重点关注 [1] 根据相关目录分别进行总结 OpenAI算力投资调整解读 - OpenAI“大幅下调”算力投资引发广泛关注,但业内人士认为这是表达口径的差异,而非预算实际下调 [1] - 公司将原来“8年广义基建”口径改为“5年算力专项”,此举并不意味着AI泡沫破灭或产业发展“刹车” [1] - 此举标志着AI产业发展进入更务实阶段,开始回归商业本质,更加关注营收利润 [1] 产业链主要动态与协议 - Meta与英伟达达成一项价值数十亿美元的芯片采购协议 [1] - Taalas芯片在行业内异军突起,表现引人瞩目 [1] 行业趋势与资本开支 - 北美云厂商的资本开支预计将继续增长 [1] - 这一趋势将使得算力及英伟达产业链继续保持高景气度 [1] 未来需求变化与投资机遇 - 在AI应用加速落地的背景下,产业链公司对算力结构、AI大模型以及商业模式的需求都将发生变化 [1] - AI推理算力与国产AI芯片领域的投资机遇值得重点关注 [1]
设备占比较高的半导体设备ETF易方达(159558)连续16日净流入,盘中再获资金净申购近5000万份
新浪财经· 2026-01-21 14:12
指数与ETF市场表现 - 截至2026年1月21日13:41,中证半导体材料设备主题指数(931743)上涨0.03% [1] - 半导体设备ETF易方达(159558)盘中获资金净申购近5000万份,换手率5.51%,成交额2.41亿元 [1] - 截至1月20日,该ETF最新规模达43.51亿元,最新份额达19.16亿份,均创成立以来新高 [1] - 该ETF近16天获得连续资金净流入,最高单日净流入6.21亿元,合计净流入23.66亿元 [1] 行业动态与政策支持 - 大湾区化合物半导体生态应用大会暨半导体产业CEO大会在珠海高新区举行 [1] - 相关领导期待更多企业将研发中心、制造基地和区域总部落在珠海,共同打造具有全球影响力的化合物半导体产业高地 [1] 行业前景与国产化机遇 - 西部证券认为,在数据中心架构升级及AI推理算力需求持续增加的背景下,服务器CPU需求端有望出现持续性增长 [1] - 国产服务器CPU近年来性能不断提升,软件兼容性持续改善,有望在需求和政策的双重驱动下实现市占率进一步提升 [1] 相关金融产品概况 - 半导体设备ETF易方达(159558)紧密跟踪中证半导体材料设备主题指数 [2] - 中证半导体材料设备主题指数选取40只业务涉及半导体材料和设备等领域的上市公司证券作为指数样本,反映该领域上市公司证券的整体表现 [2]
供需失衡驱动服务器CPU价格上涨
西部证券· 2026-01-18 11:38
行业投资评级 - 行业评级为“超配” [5] - 前次评级为“超配”,本次评级变动为“维持” [5] 报告核心观点 - 供需失衡驱动服务器CPU价格上涨,Intel与AMD计划将服务器CPU价格上调10%-15% [1] - 通用服务器市场正在复苏,全球服务器出货量有望实现超9%的同比增长 [1] - 生成式AI浪潮持续演进,AI服务器采购额上升,部分挤占通用服务器预算,同时云厂商前期采购的服务器进入更新周期,数据中心架构升级驱动补偿性投资 [2] - AI推理算力需求持续增加,云厂商有望持续扩张资本开支,2026年全球AI服务器出货量或将同比增长超20%,占服务器整体出货量比重有望上升至17% [2] - 国产新一代服务器CPU(如海光四号、龙芯3C6000、飞腾S2500)已在政务、金融、运营商等领域加速落地,稳定性和兼容性不断提高 [2] - 服务器CPU需求在数据中心架构升级和AI推理算力需求增加的背景下有望持续增长,国产服务器CPU性能提升、软件兼容性改善,有望在需求与政策驱动下进一步提升市占率 [3] 行业市场表现 - 计算机行业近一年走势强劲,相对沪深300指数表现突出 [7][8] - 计算机行业近1个月、3个月、12个月的相对表现分别为17.39%、12.26%、39.44%,同期沪深300指数表现分别为3.93%、4.82%、24.12% [8] 产业链动态与数据 - Intel与AMD的服务器CPU产能至2026年已基本预售完毕 [1] - AMD第五代EPYC “Turin”和Intel Xeon “Granite Rapids”等新一代CPU产品陆续落地,在核心数量、内存带宽等性能指标上有较大幅度提升 [1] 投资建议关注 - 报告建议关注国产CPU领域公司,包括龙芯中科、海光信息(已覆盖)、中国长城 [3]
强于大市(维持评级):传媒英伟达:Groq赋能推理算力
华福证券· 2025-12-30 17:04
行业投资评级 - 强于大市(维持评级)[7] 报告核心观点 - 英伟达与AI推理芯片公司Groq达成战略合作,共同推进推理技术,Groq团队将加入英伟达,但公司保持独立运营[2][3] - 全球AI产业正从模型训练迈入规模化推理落地关键期,推理算力需求高速增长[4] - Groq的LPU(语言处理单元)结合SRAM架构在AI推理任务中具有低延迟、高速度的优势[5] - 看好国内外推理算力需求增长带动的产业链投资机会,包括国内晶圆厂、上游设备以及海外的光模块、机柜组装代工[6] 事件背景:英伟达与Groq战略合作 - 2024年12月24日,AI芯片初创公司Groq宣布与英伟达就推理技术达成非独家许可协议[3] - Groq创始人Jonathan Ross、总裁Sunny Madra及核心团队将加入英伟达,共同推进授权技术的升级与规模化应用[3] - Groq将继续作为独立公司运营,由Simon Edwards接任CEO,其GroqCloud云服务保持正常运行[3] - Groq在2024年商业化取得突破,已吸引超过200万开发者用户,并与Meta合作运行Llama大模型,与沙特阿美达成15亿美元协议建设全球最大AI推理数据中心,成为加拿大贝尔主权AI网络的独家推理提供商[3] 行业趋势:推理市场高速扩张 - 当前全球AI产业正从模型训练阶段迈入规模化推理落地的关键期,低延迟、高能效的推理算力成为核心刚需[4] - 海外推理需求旺盛,截至今年7月,谷歌月度处理Tokens达980万亿,相较5月翻倍[4] - 国内推理需求同样高速增长,截至今年12月豆包大模型日均调用量已经突破50万亿Tokens,较去年同期增长超过10倍[4] Groq技术价值:LPU+SRAM架构 - Groq LPU(语言处理单元)的设计纲领为“为速度和精确度而生”,采用编译期静态调度与确定性执行架构,在运行大型语言模型等推理任务时实现逐token的可预测、低延迟执行[5] - Groq选择以片上SRAM作为核心存储,作为主要权重存储,显著降低了访问延迟,允许计算单元以全速拉入权重,并通过将单层拆分到多个芯片实现张量并行,这种架构成为部署快速且可扩展推理的优势[5] - Groq第二代LPU采用三星4nm(SF4X)工艺节点制造,两代芯片均未绑定台积电先进制程需求[5] 投资建议 - 看好国内外推理算力需求增长和相关产业链[6] - 国内端,建议关注晶圆厂和上游设备扩产需求[6] - 海外端,建议关注推理算力需求增长下带动的光模块、机柜组装代工需求增长[6]
七牛智能联手五象云谷,联手进军千亿AI推理算力市场
智通财经· 2025-09-18 21:32
战略合作与业务布局 - 七牛云与五象云谷达成战略合作 共同进军千亿AI推理算力市场 打造AI普惠推理算力 [1] - 公司拥有音视频云 算力AI云 灵矽AI三大产品线 基于音视频云基础全面发力AI推理算力产品 [1] - 灵矽AI产品于今年8月推出 标志公司实现从云到端的全面布局 开拓智能硬件AI市场 [1] 财务表现与用户增长 - 2025年上半年AI相关收入达1.84亿元 占总收入比重22.2% [3] - 收入主要来源于AI推理服务和算力资源租赁业务 [3] - 8月上旬至9月上旬平台AI推理需求快速增长 AI用户数增至15,000人 [3] 技术能力与平台生态 - 平台可调用大模型数量超过50个 涵盖LLM推理模型 工具调用 AI编程及Claude CodeAI推理接口 [3] - 截至8月开发者群体数量超169万 新增注册持续增长 算力需求不断攀升 [3] - 为客户提供大模型推理算力服务 算力租赁及镜像AI推理解决方案 [3] 业务协同与发展前景 - AI推理需求具有持续调用特性 每秒每分每时在千万级用户或自动化系统中触发 [3] - AI推理算力与音视频云 灵矽AI形成三位一体业务联通 成为新增长点 [3] - 合作降低AI应用开发门槛 缩短从概念验证到规模化商用周期 [3] 合作伙伴与基础设施 - 五象云谷智算中心为人工智能产业核心载体 一期总投资36亿元 建筑面积14.9万平方米 [4] - 中心可承载两个万卡集群 提供高达40000P智能算力 已完成5000P智算集群建设 [4] - 合作将释放五象云谷算力资源商业化潜力 [4] 未来拓展方向 - 双方将在AI推理算力合作基础上 探索AI+教育 AI+能源等垂直领域合作 [4]
七牛智能(2567.HK)联手五象云谷 进军千亿AI推理算力市场
格隆汇APP· 2025-09-18 20:33
战略合作与业务布局 - 公司与五象云谷达成战略合作 正式开启AI推理算力规模化布局 共同进军千亿AI推理算力市场[1] - 未来将积极探索AI+教育 AI+能源等垂直领域合作[1] - 公司拥有音视频云 算力AI云 灵矽AI三大产品线 在音视频云基础上全新发力AI推理算力产品[1] 产品与技术发展 - AI推理算力将成为公司AI业务新增长点[1] - 今年8月推出灵矽AI 标志公司实现从云到端的全面布局 开拓智能硬件AI市场[1] - 平台开发者数量超169万 新增注册量持续增长 AI算力需求不断攀升[1] 市场与服务优化 - 合作使公司能为企业客户和独立开发者提供更精细化的AI推理及算力租赁服务[1] - 大幅降低AI应用开发门槛 缩短从概念验证到规模化商用周期[1] - 加快AI应用落地进程[1]
七牛智能(02567)联手五象云谷,联手进军千亿AI推理算力市场
智通财经网· 2025-09-18 19:35
战略合作与业务布局 - 七牛云与五象云谷达成战略合作 共同进军千亿AI推理算力市场 正式开启AI推理算力规模化布局 [1] - 七牛云拥有音视频云 算力AI云 灵矽AI三大产品线 在音视频云基础上全新发力AI推理算力产品 [1] - 灵矽AI产品于今年8月推出 标志公司从云到端的全面布局 开拓智能硬件AI市场 [1] 财务表现与业务数据 - 2025年上半年AI相关收入达1.84亿元 占总收入比重22.2% 主要来自AI推理服务和算力资源租赁 [3] - 8月上旬至9月上旬平台AI推理需求快速增长 可调用大模型数量超过50个 涵盖LLM推理模型等多功能 [3] - AI相关用户快速增至15,000人 平台开发者群体数量超169万 新增注册量持续增长 [3] 业务模式与服务范围 - 提供大模型推理算力服务和推理算力租赁 为个人创业者提供镜像AI推理解决方案 [3] - AI推理需求具有持续调用特性 每秒每分每时在千万级用户或系统中被触发 成为新增长点 [3] - 与音视频云 灵矽AI形成三位一体业务联通 大幅缩短从概念验证到规模化商用的周期 [3] 合作方资源与能力 - 五象云谷智算中心项目一期总投资36亿元 总建筑面积14.9万平方米 可承载两个万卡集群 [4] - 提供高达40000P智能算力 已完成5000P智算集群建设 合作将释放算力资源商业化潜力 [4] - 未来将探索AI+教育 AI+能源等垂直领域合作 在推理算力深度合作基础上共创AI新未来 [4]
关注半导体,脑机接口,深海科技
2025-06-23 10:09
纪要涉及的行业和公司 - **行业**:芯片半导体、新消费、创新药、油气、油运、银行、保险、算力通信、新能源、白酒、稳定币 - **公司**:摩尔线程、盛合晶微、新易盛、世佳光子、沪电股份、小米 纪要提到的核心观点和论据 - **A股市场表现及影响因素**:本周A股市场整体缩量回调,成交额回到周均值1.22万亿元,较上周减少1500亿元,港股跌幅更大 影响因素包括中伊冲突升级致风险偏好下降、陆家嘴论坛政策博弈、沪指技术阻力位、宏观经济基本面复苏乏力、市场内生结构问题、季末及中报期资金切换、港股调整联动等[1][2] - **各板块表现** - **抗跌板块**:红利或蓝筹价值板块相对抗跌,资金流向银行和保险板块避险,地缘事件驱动油气、油运板块走强[1][5] - **强势板块**:芯片半导体行业表现较强,科创板分层政策支持未盈利硬科技企业上市,中美博弈加速芯片制造材料设备国产化,存储领域国产化预期提升[1][12] - **调整板块**:新消费和创新药板块拥挤度高,对利空敏感利好钝化,港股新消费和创新药板块拥挤度高且新股破发[1][5] - **轮动反弹板块**:稳定币因美股映射及政策催化持续超预期,推理算力通信防线、海丰业绩预期方向、军工、新能源等低位方向及科创芯片有表现,市场轮动方向多且速度快[9] - **创新药政策影响**:创新药临床试验申请期缩短至30天政策超出多数投资者预期,但因行情阶段性尾声,政策提振效果较弱[6][7] - **市场情绪指数**:本周市场情绪指数明显比大盘表现更弱,下跌超2.6%,涨停个数减少,市场活跃度下降[8] - **算力通信产业链**:6月初反弹,上周不佳,因北美算力叙事承压、美国大厂业绩验证推理景气度上修,临近中报资金关注业绩能见度高的方向而补涨,部分标的赔率收缩[10][11] - **新能源板块**:整体位置不高,本周光伏、固态电池和海风反弹,固态电池产业将进入中试阶段,光伏有供给侧产能调整预期[13] - **白酒行业**:本周反弹,官媒发文纠偏修复过度悲观情绪,但暂不看反转[14] - **稳定币领域**:本周表现超预期,周四、周五补跌,受中美政策共振及美股映射影响,跨国巨头和国内企业入局,美国参议院通过稳定币法案,对A股基本面影响尚不明显但具交易性特征[15] 其他重要但是可能被忽略的内容 - **投资建议**:关注芯片半导体、算力通信核心公司、AI端侧、深海科技、脑机接口、泛科技方向如商业航天和低空飞行器等[16][18] - **重要产品或事件**:下周小米YU7发布会受关注,需密切跟踪相关动态[18]