Workflow
AI推理
icon
搜索文档
每周观察 | 预计2026年QLC SSD出货有望爆发性增长;英伟达尝试调升HBM4规格;全球笔电出货量;全球AR装置出货…
TrendForce集邦· 2025-09-20 10:03
AI推理需求对存储市场的影响 - AI创造的庞大数据量冲击全球数据中心存储设施 导致Nearline HDD出现供应短缺[2] - Nearline HDD交付周期达52周 每GB平均售价0.015美元 最大容量32TB[3] - QLC SSD交付周期仅8周 每GB平均售价0.05-0.06美元 最大容量122TB 能效较高[3] - 大容量QLC SSD出货可能于2026年出现爆发性增长[2] HBM4规格升级与供应商格局 - 英伟达要求HBM4的Speed per Pin调升至10Gbps以应对AMD 2026年推出的MI450 Helios平台[3] - SK海力士在HBM4量产初期预计维持最大供应商优势[3] 全球笔记本电脑市场趋势 - 2025年全球笔电出货量预计年增2.2% 突破1.8亿台[5] - 东南亚产能持续扩张 因笔电产品享有美国进口免关税待遇[4] - 供应链为应对美国对等关税政策加速在东南亚进行产能布局[4][5] AR显示技术发展前景 - Meta首款量产AR装置采用LCoS显示技术[8] - LCoS显示产品市场占比预计2026年上升至13%[8] - 单片全彩LEDoS有望于2028年迎来技术及成本重大突破[8] 其他行业动态 - 2Q25全球智能手机生产总数达3亿支 季增约4%[13] - Micro LED手表应用推动2029年芯片市场规模突破4.61亿美元[15]
AI推理是下一个万亿市场?七牛智能与五象云谷合作,卡位产业爆发拐点
格隆汇APP· 2025-09-19 20:58
行业趋势与市场机会 - AI产业正经历从重训练向重推理的范式迁移 推理环节成为算力消耗主体 商业化爆发刚开始[2] - 未来AI算力结构将呈现训练5% 推理95%的极端分布 推理需求呈指数级膨胀[3] - Google月Token处理量从5月480万亿飙升至7月960万亿 两个月翻倍 中国日均Token量一年增长300倍达30万亿[3] - AI Agent在投研客服编程等场景落地使Token调用量比传统Chatbot提升十倍 算力需求可能增长百倍[3] 公司战略合作与竞争优势 - 与五象云谷智算中心战略合作 目标将AI推理算力做成普惠价 进军千亿级AI推理市场[2] - 推理算力核心要求是算得近算得省算得稳 对延迟成本稳定性敏感度远高于训练[4] - 拥有169万平台开发者 音视频云技术积累形成AI推理服务独特竞争优势[5] - 合作模式为生态+基础设施互补 五象云谷一期总投资36亿元 提供40000P智能算力 形成强竞争壁垒[5] 业务增长与财务表现 - AI Cloud平台调用大模型超50个 2025年上半年AI收入1.84亿港元同比增64.6% 营收占比提升至22.2%[10] - 2025年上半年经调整EBITDA收窄至-350万港元 接近盈亏平衡 亏损同比大幅收窄[13] - AI用户从8月初超1万快速增至1.5万 呈现S曲线启动态势[13] - 高毛利率AI业务加速放量 显著高于传统云业务 带来收入弹性与盈利弹性[11][12] 未来发展空间 - 政策层面契合国务院人工智能+行动意见中5次强调的普惠概念 有望获得政策支持[6] - 探索AI+教育AI+能源等垂直行业解决方案 教育领域AI批阅智能答疑等需大量推理算力[6] - 通过五象云谷位于广西的节点提供跨境推理服务 切入东南亚AI应用新兴市场[6] - 端侧多模态操作系统灵矽AI切入智能硬件市场 与云端协同处理实时交互和复杂推理[12] 商业模式与生态价值 - 完成底层基础设施-AI引擎-终端场景全栈布局 形成三层飞轮模型[8][12] - Media Cloud提供稳定现金流和169万开发者流量池 AI Cloud为增长引擎 LinX OS拓展硬件生态[9][10][12] - 庞大开发者生态构成业务安全垫 微小付费转化率提升将带来巨大收入弹性[15] - 估值相较海外同业存在显著折扣 海外同业PS倍数高达97倍[17]
AI推理是下一个万亿市场?七牛智能与五象云谷合作,卡位产业爆发拐点
格隆汇APP· 2025-09-19 20:19
文章核心观点 - 七牛智能与五象云谷智算中心战略合作 目标是将AI推理算力做成普惠价 共同开拓千亿级AI推理市场 此次合作标志着公司精准卡位AI产业从训练转向推理的拐点 并依托三层业务飞轮模型实现从工具提供商向生态赋能者的转型 公司财务表现显示盈利拐点临近 是港股市场稀缺的全栈型多模态AI平台标的 [2][3][8][9][14][17] AI推理赛道爆发背景 - 全球AI产业正经历从重训练向重推理的范式迁移 推理环节成为算力消耗绝对主体 商业化爆发刚起步 [2] - 未来AI算力结构将呈现训练5%、推理95%的极端分布 推理需求呈指数级膨胀 [3] - AI Agent智能体在投研、客服、编程等场景落地使Token调用量比传统Chatbot提升十倍以上 算力需求可能增长百倍 [4] - Google月Token处理量从2025年5月的480万亿飙升至7月的960万亿 两个月翻倍 中国日均Token量一年内增长300倍达30万亿 [4] 合作战略价值与竞争壁垒 - 推理算力核心要求是算得近、算得省、算得稳 对延迟、成本、稳定性敏感度远高于训练 技术和服务门槛更高 [5] - 七牛智能自2011年起深耕音视频云 拥有超过169万平台开发者 在音视频云技术和客户积累基础上迭代AI推理算力服务形成平台能力 [5] - 五象云谷智算中心一期总投资36亿元 可承载两个万卡集群 提供高达40000P智能算力 合作本质是生态+基础设施互补 形成难以复制的竞争壁垒 [5] - 合作完全契合2025年6月国务院《深入实施人工智能+行动的意见》中5次强调的普惠战略和智能原生概念 有望获得政策支持 [6] - 合作将探索AI+教育、AI+能源等垂直行业解决方案 这些行业数字化程度低但场景丰富需求刚性 可提供定制化推理服务实现溢价定价 [6] - 五象云谷位于广西 是中国-东盟区域桥头堡 七牛智能可通过其节点为国内开发者提供跨境推理服务 帮助中国AI应用出海东南亚市场 [7] 三层飞轮业务模型 - 底层基石Media Cloud是公司起家核心业务 提供稳定现金流和庞大高粘性开发者生态 作为向AI业务导流的天然流量池 [10] - 新增长引擎AI Cloud平台可调用大模型超过50个 支持从LLM推理到AI编程多种功能 2025年上半年AI相关收入达1.84亿港元同比大增64.6% 营收占比提升至22.2% 且毛利率显著高于传统云业务 [11] - 顶层生态延展多模态OS灵矽AI是端侧操作系统 让智能硬件具备看、听、说、理解能力 与云端协同处理实时交互和复杂推理 切入智能硬件蓝海市场 [12] - 三层飞轮串联形成闭环 Media Cloud输血获客 AI Cloud提供增长弹性 LinX OS拓展增量场景 公司转型为AI时代运营平台 客户粘性、定价权和现金流质量有望跳档 [13] 财务表现与估值潜力 - 2025年上半年公司经调整EBITDA收窄至-350万港元 非常接近盈亏平衡点 亏损同比大幅收窄 驱动因素是高毛利率AI业务加速放量 [15] - AI相关用户从2025年8月初超1万快速增至1.5万 呈现典型S曲线启动态势 [15] - 合作将为企业级客户和个人开发者提供更精细的大模型推理与算力租赁服务 缩短从概念验证到规模化商用周期 吸引长尾客户 ARPU值有望提升 [16] - 超过169万平台开发者构成坚实基本盘和流量来源 微小付费转化率提升将为收入带来巨大弹性 [16] - 当前市值估值倍数相较海外同业如Nebius的97倍PS存在显著折扣 未来催化剂包括合作项目订单落地、LinX OS与智能硬件厂商合作、2025年报AI收入占比提升等 [17]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
搜狐财经· 2025-09-18 14:34
项目进展 - 6个月建成算力集群 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72 [1] - 项目进度远超行业标准 6个月完成OpenAI和甲骨文等合作方15个月的工作量 [1] - 2025年3月7日启动Colossus II项目 收购100万平方英尺仓库及100英亩地块 [4] - 截至8月22日安装119台风冷式冷水机组 提供200MW冷却能力 [4] - 第一阶段部署11万个GPU 最终目标超过55万个GPU 峰值功率需求超1.1吉瓦 [4] - 部署168个特斯拉Megapack电池储能系统 避免对当地电网造成冲击 [5] 技术架构 - 基于xAI大型语言模型Grok构建多智能体系统 部署数百个专用智能体 [2] - 智能体分工涵盖编码 图像视频生成 软件测试等全流程 [2] - 系统通过虚拟机模拟人类用户交互 实现软件开发生命周期全自动化 [2] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 [4] - 发电厂已运行7台35MW燃气涡轮机 总输出245MW [4] - 通过合资公司获得400MW燃气涡轮机服务 占供应商总容量600MW的67% [5] 战略布局 - 项目命名为"巨硬计划"(MACROHARD) 2021年已有初步构想 [2] - Colossus II专为AI推理设计 规模较Colossus I扩大数十倍 [4] - 与特斯拉形成协同效应 AI软件优化自动驾驶算法及工厂自动化 [6] - 特斯拉提供海量真实世界训练数据 公司定位转向"AI机器人公司" [6] - 长远路线图计划将GPU总量扩展至100万个 [4] 资源投入 - 合资公司第二季度资本支出1.12亿美元 [5] - 密西西比州监管机构特批12个月燃气轮机运行许可 无需正式审批 [4] - 马斯克亲自督导项目 包括电力生产审查和技术评审 [5]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
量子位· 2025-09-18 14:09
巨硬计划项目概述 - 马斯克旗下xAI推进"巨硬计划" 基于Grok大型语言模型构建多智能体系统 部署数百个专门AI代理协同模拟完整软件开发团队[3] - 项目核心逻辑为软件公司不生产实体硬件 因此从编码设计测试到管理的全部流程均可被AI复制[5] - 巨硬计划开发的AI软件将用于优化特斯拉自动驾驶算法 工厂自动化和人形机器人Optimus功能 特斯拉海量真实世界数据反哺训练[17] 算力基础设施部署 - Colossus II算力集群6个月从零建成 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72[1][12] - 项目第一阶段部署11万个GB200 GPU 最终目标超55万个GPU 峰值功率需求超1.1吉瓦 长远规划扩展至100万个GPU[13][14] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 现有7台35MW燃气轮机运行 另部署168个特斯拉Megapack电池储能系统保障供电[15] 建设进度与比较优势 - 仅用6个月完成OpenAI和甲骨文等合作方15个月的工作量 创造行业新纪录[2] - Colossus I集群曾用122天建成约20万台H200 GPU 92天内规模翻倍 至今仍是最大AI训练算力集群[6][8] - Colossus II于2025年3月7日启动 收购100万平方英尺仓库和100英亩地块 7月已开始安装机架[10][11] 资源投入与执行力度 - 与Solaris Energy Infrastructure成立合资公司(Solaris持股50.1% xAI持股49.9%) 第二季度投入1.12亿美元资本支出[15] - 马斯克亲自督战 周末连续进行技术评审 现场审查变压器和电力生产进展 项目进入冲刺阶段[16] - 密西西比州监管机构临时批准发电厂运行燃气轮机12个月 无需正式许可 加速部署进程[15]
AI芯片黑马融资53亿,估值490亿
半导体行业观察· 2025-09-18 10:09
融资与估值 - Groq Inc 宣布完成7.5亿美元的新一轮融资,由Disruptive领投,思科、三星电子、德国电信资本合伙公司等多家机构参与 [3] - 公司当前估值为690万美元,相比去年的28亿美元估值有显著提升 [3] 核心技术:语言处理单元 - Groq推出的语言处理单元是一款专为AI推理设计的处理器,声称在运行某些推理工作负载时,能效比显卡高10倍 [3][8] - LPU通过降低处理器组件间的协调开销,为AI模型推理释放更多处理能力,能够运行包含1万亿个参数的模型 [3] - 芯片采用确定性架构,可以单个时钟周期的粒度预测计算操作时间,有助于实现性能优化 [4] 技术优势与设计原则 - LPU使用自定义编译器,在推理工作负载启动前预先计算任务分配,减少运行时计算开销 [4] - 编译器采用改进的RealScale量化技术,仅压缩神经网络中输出质量不会显著下降的部分,以减少内存占用 [4] - 设计原则包括软件优先、可编程装配线架构、确定性计算和网络、以及片上存储器 [8] - 软件优先原则使开发人员能最大化硬件利用率,LPU专为线性代数计算设计,简化了多芯片计算范式 [9][10] - 可编程装配线架构通过数据"传送带"在功能单元间传输指令和数据,由软件完全控制,无需硬件同步,消除了瓶颈 [11][12] - 确定性计算确保每个执行步骤完全可预测,通过消除数据带宽和计算资源的争用来实现高度确定性 [13] - 片上存储器采用SRAM,内存带宽高达80 TB/秒,相比GPU片外HBM的约8 TB/秒,速度提升10倍,并减少了数据检索的延迟和能耗 [14] 产品与市场应用 - 公司将芯片作为GroqRack设备的一部分出售,该系统包含九台服务器,每台配备多个LPU,所需外部网络硬件更少,降低了成本且易于数据中心安装 [4] - 通过云平台GroqCloud提供芯片访问,开发者可通过API将LPU驱动的AI模型集成到自身软件中;新融资将用于扩展支持该平台的数据中心网络 [5] - 有报道称竞争对手推理芯片供应商Rivos正寻求以20亿美元估值融资至多5亿美元,其产品为结合显卡与CPU核心的片上系统 [6]
中金:英伟达Rubin CPX采用创新解耦式推理架构 或驱动PCB市场迭代升级
智通财经网· 2025-09-17 16:34
Rubin CPX产品创新 - 采用解耦式推理架构 专为处理超长上下文AI推理任务设计[1] - 在NV FP4精度下提供30 Peta FLOPS计算性能[1] - 配备128GB GDDR7内存 内存带宽达2TB/s[1] - 采用传统FC-BGA倒装封装的单芯片设计[1] 硬件架构升级 - 托盘前端采用模块化设计 四块子卡分布于托盘两侧[2] - 包含2块Rubin CPX GPX芯片与2块CX-9网卡[2] - 散热系统由风冷升级为液冷 Tray内新增液冷板[2] - 热管和均热板将热量从GDDR7内存模块传导至冷板[2] - 采用无线缆架构 新增Paladin B2B连接器[1][2] - 连接器与机箱中间的PCB中板(mid plane)相连[1][2] PCB市场价值提升 - VR200NVL144单机柜PCB价值量约45.6万元[3] - 单GPU对应PCB价值量为6,333元(880美元)[3] - 较GB300提升113%[3] - 预计2027年GB300 NVL72/VR200 NVL144/VR300 NVL576出货量分别为1/7/2万rack[3] - 合计10万rack 对应PCB市场规模达69.6亿美元[3] - 较2026年增长142%[3] 产业链受益标的 - 生益科技(600183SH) 深南电路(002916SZ) 兴森科技(002436SZ)[4] - 鹏鼎控股(002938SZ) 东山精密(002384SZ) 胜宏科技(300476SZ)[4] - 沪电股份(002463SZ) 生益电子(688183SH) 景旺电子(603228SH)[4] - 方正科技(600601SH) 广合科技(300964SZ)等[4]
中金:英伟达(NVDA.US)Rubin CPX采用创新解耦式推理架构 或驱动PCB市场迭代升级
智通财经网· 2025-09-17 16:32
Rubin CPX产品架构创新 - 采用解耦式推理架构专为超长上下文AI推理任务设计 在NV FP4精度下提供30 Peta FLOPS算力性能[1] - 配备128GB GDDR7内存且内存带宽达2TB/s 采用传统FC-BGA倒装封装的单芯片设计[1] - 托盘前端采用模块化设计 四块子卡分布于托盘两侧包含2块Rubin CPX GPX芯片与2块CX-9网卡[2] 硬件端技术升级 - 散热方案由风冷升级为液冷 Tray内新增液冷板通过热管和均热板传导GDDR7内存模块热量[2] - 连接器/PCB采用无线缆架构 新增Paladin B2B连接器与机箱中间的PCB中板相连[1][2] 市场规模与价值量预测 - 单机柜PCB价值量约45.6万元 单GPU对应PCB价值量6,333元(880美元)较GB300提升113%[3] - 2027年GB300 NVL72/VR200 NVL144/VR300 NVL576出货量预计达1/7/2万rack 合计10万rack[3] - 2027年英伟达AI PCB市场规模预计达69.6亿美元 较2026年增长142%[1][3] 产业链受益标的 - PCB产业链涉及生益科技 深南电路 兴森科技 鹏鼎控股 东山精密 胜宏科技 沪电股份 生益电子 景旺电子 方正科技 广合科技等上市公司[4]
算力需求重心从训练转向推理 全球AI基础设施建设全面加速
中国证券报· 2025-09-16 06:20
甲骨文业绩与算力需求转变 - 甲骨文单日股价大涨40% 主要受云基础设施业务剩余履约义务同比增长359%至4550亿美元推动 其中近60%来自与OpenAI签署的5年3000亿美元推理算力订单[1] - 公司预计2026财年云基础设施收入同比增长77%至180亿美元 并给出未来四年增长指引:320亿/730亿/1140亿/1440亿美元[2] - 算力需求结构从训练为主转向推理为主 甲骨文CEO表示AI推理市场规模将远超训练市场 推理算力正被耗尽[1] AI推理商业化与行业应用 - 中国信通院指出算力结构正从70%用于训练转向70%用于分布式推理 大模型推理应用成为智能化转型核心引擎[2] - IDC认为2025年AI算力将进入"训推拐点" 商业模式从技术竞赛转向价值共享与产业落地[3] - 国家数据局披露中国日均Token消耗量突破30万亿 一年半增长300多倍 沙利文报告显示中国企业级大模型日均Token消耗量达10.2万亿 较2024年底暴涨363%[3] 云厂商AI基础设施投入 - 阿里云季度收入同比增长26%至333.98亿元 AI相关收入连续八季度实现三位数增长[4] - 中国AI云市场2025年上半年规模达223亿元 预计全年增长148% 2030年将达1930亿元[5] - BAT第二季度资本开支合计615.83亿元 同比上涨168% 阿里云宣布三年投入3800亿元用于云和AI基础设施 季度资本开支达386亿元创历史新高[6] 全球AI基础设施竞争格局 - 摩根士丹利上调2025年全球11大云厂商资本支出预期至4450亿美元 年增56% 2026年预计达5180亿美元[6] - 阿里云今年新增8个全球数据中心 覆盖中国/泰国/韩国/马来西亚/阿联酋/墨西哥[6] - 万卡级算力集群成为行业标配 但中国面临算力芯片生态碎片化挑战 有数十款芯片对应不同开发框架[7] 技术瓶颈与产业协同 - 大规模算力集群需解决互联效率损失问题 以提升整体计算效率[7] - 工信部强调要加快突破GPU芯片等关键技术 扩大基础共性技术供给 推进算力强基行动[7] - 产业各方需共同完善算力网络技术标准体系 聚焦智算卡间互联/机间互联/AI应用跨架构迁移等方向[8]
算力需求重心从训练转向推理全球AI基础设施建设全面加速
中国证券报· 2025-09-16 04:22
甲骨文业绩与算力需求转变 - 甲骨文单日股价大涨40% 受云基础设施剩余履约义务同比增长359%至4550亿美元推动 其中近60%来自与OpenAI的5年3000亿美元推理算力订单[1] - 公司预计2026财年云基础设施收入同比增长77%至180亿美元 并预测后续四年分别增至320亿/730亿/1140亿/1440亿美元[2] - 算力需求结构从训练为主转向推理为主 甲骨文CEO称推理市场规模远超训练市场 当前推理算力正被耗尽[1] 全球算力市场结构转型 - 中国信通院指出算力结构正从70%以上用于训练转向70%以上用于推理 IDC预测2025年AI算力进入"训推拐点"[2] - 中国企业级大模型日均Token消耗量达10.2万亿 较2024年底暴涨363% 全国日均Token消耗量突破30万亿[3] - 生成式AI推动中国AI云市场2025年上半年达223亿元 预计全年增长148% 2030年规模将达1930亿元[3] 云厂商资本开支与基础设施投入 - BAT第二季度资本开支合计615.83亿元 同比上涨168% 重点投向AI基础设施与核心技术研发[4] - 阿里云宣布三年投入3800亿元用于云和AI硬件 季度资本开支达386亿元创历史新高 全球新增8个数据中心[4] - 全球11大云厂商2025年资本支出预期上调至4450亿美元 年增56% 2026年预计达5180亿美元[4] 技术挑战与产业协同需求 - 万卡级算力集群成为投资标配 需解决互联效率损失问题以提升整体计算效率[5] - 中国算力芯片生态存在碎片化挑战 涉及数十款芯片与不同开发框架/软件栈/算子库[5] - 工信部强调加快突破GPU芯片等关键技术 中国移动呼吁完善算力网络技术和标准体系[5]