软件生态
搜索文档
瞄准英伟达,国产算力产业走向“闭环”
36氪· 2026-01-09 20:39
文章核心观点 国产算力产业在资本市场表现活跃,多家核心公司成功上市或推进IPO,标志着产业进入快速发展与资本化新阶段[1] 同时,行业竞争焦点已从硬件参数比拼转向大规模集群的稳定性、软件生态的易用性及商业落地的性价比[3] 通过硬件互连技术的突破、存储芯片的自主化、计算架构的开放解耦以及软件生态的积极构建,国产算力产业已初步形成从底层硬件到上层应用的生态闭环,具备了应对外部挑战和把握市场机会的能力[17] 资本市场动态与公司进展 - **天数智芯**于2026年1月8日在港股上市,公开发售获超400倍认购,显示资本市场热情高涨[1] - **摩尔线程**于2025年12月5日登陆科创板,上市首日股价一度上涨468.78%,总市值突破3055亿元[1] - **沐曦股份**于2025年12月17日登陆科创板,上市首日涨幅达692.95%,市值站上3300亿元[1] - **长鑫科技**于2025年12月30日递交科创板招股书,披露2025年前三季度营收达320.84亿元,2022至2024年主营业务收入复合增长率超70%[1][6] - **长存集团**于2025年9月25日完成股份制改革,估值达1600亿元,刷新半导体独角兽纪录[1] 硬件竞争焦点:万卡集群与互连技术 - 行业竞争新标尺转向“万卡集群”的稳定性、软件生态易用性及商业落地性价比[3] - **中科曙光**发布scaleX万卡超集群,由16个scaleX640超节点互连,实际部署10240块AI加速卡[3] - 万卡集群面临指数级增长的故障概率挑战,系统可靠性面临严峻考验[3] - 集群核心突破在于采用国产首款400G原生RDMA网络,以解决高速数据传输瓶颈,其规格指标和实测稳定性已可对标英伟达当前量产产品[4][5] - 未来技术挑战在于物理极限,铜缆传输距离随速率提升急剧缩短,行业需向硅光技术发展以突破极限[5] 存储芯片自主化进展 - **长鑫科技**作为中国最大DRAM设计制造一体化企业,产品线覆盖DDR4到DDR5、LPDDR5X,其首款国产DDR5产品速率达8000Mbps[6] - **长存集团**在NAND Flash领域凭借Xtacking架构实现技术突围[7] - DRAM及衍生的HBM是决定GPU性能上限的核心要素,NAND Flash则是底层存储基础[6][7] - 2025年下半年以来,全球存储颗粒(DRAM/NAND)供应压力巨大,国产化尚无法完全解决全球性供需失衡,导致云厂商采购策略前置[13] 计算架构开放与生态协作 - 行业共识从“全产业链通吃”转向“分层解耦、各司其职”[9] - **海光信息**开放其HSL高速互连总线协议,实现了海光CPU与各家GPU的异构互联,拉通了CPU与GPU[8] - **光合组织**秘书长指出,大规模算力系统已非单一品牌独角戏,协议的打通是关键[7] - 这种技术解耦与开放架构,旨在构建更开放的生态,避免厂商各自为战导致的生态割裂与用户适配成本高企[11] 软件生态构建与迁移策略 - 在英伟达CUDA生态主导下,开发者切换至国产平台面临巨大代码重构与学习成本[10] - **摩尔线程**策略是从个人开发者抓起,发布“MTT AIBOOK”AI算力本实现开箱即用,并推出代码生成大模型MUSACode,声称CUDA到MUSA代码自动化迁移可编译率达93%[10] - 在企业级市场,云服务商承担“屏蔽差异”职责[11] - **优刻得**作为云服务商,向下适配3到5家主流的国产芯片,通过虚拟化和统一调度屏蔽底层硬件割裂,统一管理异构算力[11][12] - **紫光计算机**看到本地化价值,推出带前置可插拔硬盘仓的AI工作站,以应对网络延迟、隐私风险及海量数据交换效率问题[12] 应用落地、客户选择与市场风向 - **中国科学院高能物理研究所**已开始采用国产算力设施进行AI训练和科学计算,评价其性能“完全够用”,并与芯片厂商进行联合调试优化[14] - 国内互联网大厂态度变化,从直接采购国际主流芯片转向希望拥有更多话语权和接受更开放的架构[14] - **海光信息**推出定制化产品,允许大厂将特殊需求写入芯片,以建立深层绑定[14] - 行业认为2026年是Agent(智能体)元年,其对算力的消耗是指数级增长,算力依然短缺,问题在于供需错配而非总量过剩[15] - **DeepSeek**等国产大模型的爆发反向定义硬件标准,如采用FP8量化策略,促使芯片厂商优化底层计算库以支持特定计算格式[15][16] 产业链闭环与应对挑战的能力 - 面对美国可能放宽英伟达H200芯片出口限制的传闻,行业强调国内政企客户对供应链安全有刚性考量[17] - 国产算力产业链已形成闭环:从**长鑫科技**、**长存集团**的存储底座,到**中科曙光**、**海光信息**的计算与网络集群,再到**摩尔线程**、**天数智芯**适配的终端应用[17] - 过去几年,中国算力产业已初步形成紧密咬合的生态闭环,具备了进一步直面挑战的能力[17]
瞄准英伟达!国产算力产业走向“闭环”
经济观察报· 2026-01-09 18:28
资本市场热潮与国产算力产业进步 - 国产算力产业在资本市场运作提速,天数智芯在港交所上市,公开发售获超400倍认购 [2] - 国产GPU头部企业摩尔线程和沐曦股份登陆科创板,上市首日股价分别一度上涨468.78%和692.95%,市值分别突破3055亿元和3300亿元 [2] - 国产存储芯片厂商长鑫科技递交科创板招股书,披露2025年前三季度营收达320.84亿元,2022至2024年主营业务收入复合增长率超70% [2] - 长江存储完成股份制改革,估值达1600亿元,刷新半导体独角兽纪录 [3] - 从芯片设计到存储颗粒,从科创板到港交所的资本热潮间接宣告了国产算力产业的快速进步 [1][4] 硬件竞争焦点转移与“万卡集群”挑战 - 国产算力竞争焦点从比拼硬件参数,转向“万卡集群”的稳定性、软件生态易用性及商业落地性价比 [6] - “万卡集群”意味着指数级增长的故障概率,中科曙光发布的scaleX万卡超集群部署了10240块AI加速卡 [6] - 专家指出,当系统规模达到十万张卡时,平均一小时要出一次错,只要一张卡出错,整个系统就得停下来 [6] - 硬件厂商在“连接”上寻求突破,中科曙光集群采用国产首款400G原生RDMA网络,以解决大规模协同计算对高信号质量、低延迟、大带宽网络的需求 [7] - 英伟达通过GPU、NVLink和InfiniBand网络构成“三驾马车”产品体系,节点间高速互连网络是决定AI集群效率的关键瓶颈 [8] - 未来需采用硅光技术以突破铜缆在高速率下传输距离急剧缩短的物理极限 [8] 存储与计算协同及产业分工 - 在解决“连得上”问题后,需解决“存得下”问题,长鑫科技和长江存储分别卡位DRAM和NAND Flash两大核心存储领域 [9] - 长鑫科技产品线覆盖DDR4到DDR5、LPDDR5X,其首款国产DDR5产品速率达8000Mbps,DDR5承担AI集群数据预处理,其衍生的HBM是决定GPU性能上限的核心要素 [9][10] - 长江存储凭借Xtacking架构在3D NAND领域实现技术突围 [10] - 产业逻辑转向分层解耦、各司其职,海光信息开放其HSL高速互连总线协议,实现了海光CPU与各家GPU的异构互联,技术解耦折射出商业逻辑的妥协与成熟 [11] 软件生态构建与迁移挑战 - 软件生态迁移是比硬件建设更复杂的系统工程,开发者从英伟达CUDA生态切换至国产平台面临巨大代码重构与学习成本 [13] - 摩尔线程发布“MTT AIBOOK”AI算力本预置全栈开发工具,并推出代码生成大模型MUSACode,声称可实现从CUDA代码到MUSA代码的自动化迁移,可编译率达93% [13] - 在企业级市场,云服务商承担“屏蔽差异”职责,优刻得向下适配3到5家主流的国产芯片,通过虚拟化和统一调度,让上层应用感知不到底层硬件差异 [15] - 行业存在生态割裂、互不兼容的问题,构建开放的生态架构已成为行业生存的必选项 [15] - 紫光计算机看到“本地化”价值,推出带有前置可插拔硬盘仓的AI工作站,以应对云端AI的网络延时、隐私风险及海量数据交换效率问题 [16] 供应链波动与产业新变量 - 2025年下半年以来,全球存储颗粒(DRAM/NAND)供应压力巨大,国产化尚无法完全解决全球性供需失衡 [17] - 为应对缺货,云厂商改变采购策略,从按季度规划拉长到按半年规划,并前置采购计划 [17] - 2026年被认为是Agent(智能体)元年,其对算力的消耗是指数级增长,从供需关系看,算力依然短缺,行业面临的是供需错配而非总量过剩 [20] - DeepSeek等国产大模型的爆发反向定义硬件竞争标准,如其采用FP8量化策略,要求芯片厂商优化底层计算库以支持特定计算格式 [21] 应用落地、客户选择与产业闭环形成 - 检验国产算力成色的最终标准是客户选择,中国科学院高能物理研究所已采用国产算力设施进行AI训练和科学计算,评价其性能“完全够用” [19] - 合作模式发生变化,科学家深入参与芯片调优过程,通过联合调试加速软硬件适配 [19] - 国内互联网大厂态度变化,希望拥有更多话语权,接受更开放的架构,海光信息推出定制化产品以迎合需求,建立深层客户绑定 [19][20] - 面对美国可能放宽英伟达H200芯片出口限制的潜在变量,行业认为国内政企客户对供应链安全有刚性考量,且国产算力产业链已形成闭环 [21] - 从长鑫科技、长江存储的存储底座,到中科曙光、海光信息的计算与网络集群,再到摩尔线程、天数智芯适配的终端应用,国产芯片产业已形成一个完整、庞大的产业链条,初步形成生态闭环 [21][22]
国产算力产业走向“闭环”
经济观察网· 2026-01-09 16:41
资本市场表现与产业进展 - 国产GPU厂商在2025年末至2026年初密集登陆资本市场,天数智芯港股上市获超400倍认购,摩尔线程与沐曦股份科创板上市首日股价分别一度上涨468.78%和692.95%,市值分别突破3055亿元和3300亿元 [1] - 国产存储芯片厂商完成关键资本运作,长鑫科技于2025年12月30日递交科创板招股书,披露2025年前三季度营收达320.84亿元,2022至2024年主营业务收入复合增长率超70% [1][7] - 长江存储于2025年9月25日完成股份制改革,估值达1600亿元,刷新半导体独角兽纪录 [2] 硬件集群的挑战与突破 - 国产算力竞争焦点转向“万卡集群”的稳定性、软件生态易用性与商业落地性价比 [3] - 大规模集群面临可靠性挑战,十万卡系统平均一小时出错一次,单点故障可导致整个系统停机 [3][4] - 硬件厂商在高速互连网络技术上取得突破,中科曙光发布采用国产首款400G原生RDMA网络的scaleX万卡超集群,其规格指标与实测稳定性已可对标英伟达当前量产产品 [5][6] - 未来技术挑战在于物理极限,铜缆在高速率下传输距离急剧缩短,业界判断未来需依赖硅光技术实现芯片直接出光 [6][7] 存储与计算产业链协同 - 长鑫科技与长江存储分别卡位DRAM和NAND Flash两大核心存储领域,为算力提供存储底座 [7] - 长鑫科技产品线覆盖DDR4至DDR5、LPDDR5X,其首款国产DDR5产品速率达8000Mbps,HBM(高带宽内存)是决定GPU性能上限的核心要素 [7][8] - 长江存储凭借Xtacking架构在3D NAND领域实现技术突围 [8] - 产业链走向分层解耦与开放合作,海光信息开放其HSL高速互连总线协议,实现了海光CPU与各家国产GPU的异构互联 [9][10] 软件生态构建与迁移 - 在英伟达CUDA生态主导下,国产计算平台面临巨大的开发者迁移与代码重构成本 [11] - 摩尔线程通过发布预置全栈开发工具的“MTT AIBOOK”AI算力本及代码生成大模型MUSACode(声称CUDA到MUSA代码自动化迁移可编译率达93%)来降低个人开发者门槛 [11] - 在企业级市场,云服务商(如优刻得)通过虚拟化与统一调度来屏蔽底层不同品牌国产加速卡的生态割裂与不兼容问题,为拥有多类型国产算力硬件的客户提供统一管理方案 [12][13] - 终端侧出现“本地化”创新,紫光计算机推出带前置可插拔硬盘仓的AI工作站,以应对云端AI的网络延迟与隐私风险,提升海量数据交换效率 [13][14] 应用落地、供应链与未来展望 - 国产算力已在科研等高要求场景得到应用,中国科学院高能物理研究所采用海光CPU与DCU进行AI训练和科学计算,评价其性能与国外产品差距不大且完全够用 [15] - 国内互联网大厂态度转变,从采购国际主流芯片转向寻求更开放的架构与更多话语权,海光信息通过提供定制化芯片产品来迎合此需求并建立深度绑定 [15][16] - 上游存储颗粒(DRAM/NAND)供应在2025年下半年以来压力巨大,全球性供需失衡对2026年产业构成挑战,云厂商已拉长采购规划周期以应对缺货 [14] - 国产大模型(如DeepSeek采用FP8量化策略)正在反向定义硬件竞争标准,推动芯片厂商优化底层计算库以支持特定计算格式 [16][17] - 行业认为算力需求依然短缺,当前问题是供需错配而非总量过剩,Agent(智能体)应用的兴起预计将带来指数级增长的算力消耗 [16] - 尽管面临外部潜在变量(如美国可能放宽英伟达H200芯片出口限制),但国内政企客户对供应链安全有刚性考量,且国产算力产业链已从存储、计算、网络到终端应用形成初步生态闭环,具备直面挑战的能力 [17]
百度李彦宏的第二家上市公司来了!
新浪财经· 2026-01-04 21:26
昆仑芯上市申请与市场反应 - 百度集团于2026年1月2日公告,其AI芯片子公司昆仑芯已于1月1日以保密形式向香港联交所提交主板上市申请,上市后仍为百度附属公司,将成为百度创始人李彦宏控股的第二家上市公司 [2][28] - 受分拆上市消息影响,百度集团股价于1月4日大涨9.35%,报收143.8港元/股,总市值达3955亿港元 [3][29] - 市场对分拆上市早有预期,2025年12月5日相关传闻已刺激百度股价盘中一度涨超7%,收盘涨幅超5% [5][31] 上市筹备与分拆动因 - 上市传闻于2025年12月7日获百度公告确认,公司正进行评估但强调存在监管审批不确定性,至2026年1月2日正式公告落地 [7][33] - 上市前置准备包括:2025年11月中旬招聘投融资律师岗位;12月中旬完成关键工商变更,企业类型改为股份有限公司,注册资本从约2128万元增至4亿元,增幅高达1780% [7][33] - 百度公告阐述分拆原因:提升昆仑芯独立市场形象以拓展业务、使百度股东分享其成长、便于昆仑芯独立融资以优化百度资源配置、使双方管理层权责更清晰并提升专注度与治理水平 [7][33] 公司业务与产品线 - 昆仑芯起源于2011年百度内部FPGA AI加速器项目,于2021年4月正式独立为公司,早期主要为满足百度内部大模型训练与推理需求,以降低成本(自研芯片成本约2万元人民币 vs 外购1万美元/片) [8][34] - 公司已形成从芯片、服务器到软件平台的全栈产品线,核心芯片迭代至昆仑芯2代和2025年发布的P800,P800专为大规模AI集群设计,显存规格较同期主流竞品提升20%-50%,已用于万卡及三万卡级别算力集群 [8][10][34][36] - 2025年11月百度世界大会发布新一代产品规划:针对大规模推理场景优化的昆仑芯M100计划2026年上市;面向超大规模多模态模型训练推理的昆仑芯M300计划2027年推出 [10][36] 客户订单与财务表现 - 昆仑芯已收获多家知名客户和大额订单:2025年3月P800服务器中标招商银行AI芯片资源项目;2025年8月在中国移动AI通用计算设备(推理型)集采项目中,于三个标包份额分别为70%、70%、100%,均排名第一,中标订单规模达十亿级 [11][37] - 外部客户包括百度、中国移动、招商银行、南方电网、比亚迪等行业巨头,外部客户占比约40% [11][37] - 据媒体报道,昆仑芯2024年营收超过10亿元,2025年营收远超20亿元;摩根大通研报预计其芯片收入将从2025年约13亿元飙升至2026年83亿元,增长超6倍 [11][37] 融资历程与股东结构 - 公司独立后首轮融资估值即达130亿元人民币,领投方为CPE源峰,IDG资本、君联资本、元禾璞华等参与 [15][41] - 最新一轮(D轮)融资于2025年7月完成,募资约2.83亿美元(约合21亿元人民币),投后估值约210亿元,投资方包括国新基金下属高层次人才基金、比亚迪、中金观博、中移和创等 [3][15][29][43] - 目前股东名单多达44位,百度为控股股东持股59.45%,其他重要股东包括中国互联网投资基金(持股约1.09%)、北京市人工智能产业投资基金(持股约1.50%)、比亚迪(持股约0.27%)和中国移动旗下基金(持股约2.5%) [15][43] 行业对比与估值分析 - 与国内同行相比,昆仑芯最新估值210亿元显著低于动辄千亿市值的同行:行业龙头寒武纪2025年上半年营收28.81亿元,市值一度突破6000亿元;摩尔线程2024年营收4.38亿元,最新市值3830亿元,其科创板上市首日收盘价较发行价上涨425.46%,市值达2823亿元 [13][14][39][40] - 分析认为估值差异源于叙事与生态:寒武纪讲述“云边端一体”生态平台故事并获得高溢价;摩尔线程凭借GPU“跨域兼容”图形与计算两大场景及创始团队光环获得高估值;昆仑芯当前叙事聚焦“替代+降本”,被视为成本中心,且专注于推理加速场景,市场想象力上限较低 [21][22][47][48] - 全球AI芯片竞争核心在于软件生态、开发者社区和产业联盟构成的“生态系统”,英伟达凭借CUDA生态建立护城河,国内市场生态领导者为华为昇腾 [19][45] 百度集团业绩与AI转型 - 百度集团2025年第三季度总营收312亿元,同比减少7%,连续两个季度下滑;核心在线营销收入153亿元,同比下滑18%;净亏损112.32亿元,主要因一次性计提162亿元长期资产减值,源于对AI发展趋势预判不足导致部分基础设施过早淘汰 [24][50] - 百度App 2025年9月月活7.08亿,同比仅增长1%;在广告主媒介地位指数中排名第九,位于抖音、淘宝、微信、快手、小红书等之后 [24][50] - 百度正转向AI,2025年第三季度首次系统披露AI业务收入达96亿元,同比增长超50%,其中:AI云服务收入42亿元(同比增长33%,高性能计算基础设施订阅收入激增128%)、AI原生营销服务收入28亿元(同比增长262%)、AI应用收入26亿元(同比增长6%) [25][51]
“港股GPU第一股”上市大涨,国产算力竞争升维
21世纪经济报道· 2026-01-02 17:54
公司上市表现与市场热度 - 公司于2026年1月2日登陆港交所,早盘高开一度涨超118%,市值破千亿港元,暗盘交易阶段股价一度涨幅超过90% [1] - 作为港交所18C章落地以来最大募资特专科技股,申购阶段获得超2300倍认购,有23家基石投资人加持 [1] 财务与商业化进展 - 公司收入实现指数级增长:2022年营业收入约50万元,2023年拥有12名客户实现收入约6203万元,2024年收入跃升443.29%至约3.37亿元,客户达13家,年平均交易额同比提升113.64%至940万元 [2] - 截至2025年12月15日,公司特专科技产品有五份框架销售协议及24份销售合同,总价值约为人民币12.41亿元,已向九家财富中国500强企业提供解决方案,其中五家为财富世界500强 [2] - 2023年与一家IT公司订立战略合作协议,并于当年11月就总值约3.68亿元的产品订立销售框架协议,同月收到约3500万元销售订单,2024年4月及后续又分别收到价值约1.37亿元和3140万元的销售订单 [7] 产品与技术发展 - 公司已开发出第一代GPGPU架构,并基于此开发BR106、BR110两款芯片及相关硬件产品,通过Chiplet技术推出性能更高的BR166芯片产品 [2] - 公司计划推出基于第二代架构的下一代旗舰数据中心芯片BR20X系列,预计于2026年商业化上市,将提供更强的单卡运算能力并增强对FP8、FP4等数据格式的原生支持 [8] - 公司同步规划未来一代BR30X产品用于云训练及推理,以及BR31X用于边缘推理,预计将于2028年实现商业化上市,目前正进行可行性分析及初步研发 [8] - 公司开发的BIRENSUPA软件平台提供编程接口、算法库、训练与推理框架及工具链,兼容第三方GPGPU计算软件平台,以降低客户迁移成本 [8] 集群能力与行业应用 - 公司是中国最早实现千卡集群商用的GPGPU公司之一,其千卡集群可连续运行5天以上软硬件无故障,训练服务30多天不中断 [7] - 2024年,公司赢得商业化AIDC千卡GPU集群项目,并将GPGPU集群部署于5G新通话等场景,与国内三大电信运营商开展合作 [6] - 公司增加了对BR10X系列产品的销售,该系列是专为AI工作负载定制的通用高性能计算架构,可为大语言模型及传统AI计算内核提供高效处理 [6] 行业生态合作与标准建设 - 2025年,公司参与启动中国移动智算开放互联OISA生态共建战略合作,并发布OISA 2.0协议,携手发布“芯合”异构混合并行训练系统1.0 [9] - 2024年12月,公司联合中国电信研究院、江苏电信等共同推出“智算异构四芯混训解决方案”,基于公司及英伟达等GPU完成四款异构芯片混合训练同一大模型的测试验证 [9] - 2024年7月,公司加入中国联通智算联盟,与产业链合作伙伴共建智算产业生态 [9] - 公司担任全国信标委人工智能分委会智能计算工作组联合组长期间,深度参与了近10项国家标准制定,并牵头制定《人工智能智算集群异构人工智能芯片混合训练功能规范》 [10] 市场机遇与行业趋势 - 中国智能计算芯片市场以收入计从2020年的17亿美元增长至2024年的301亿美元,复合年增长率为105%,预计到2029年将达2012亿美元,2024年至2029年复合年增长率为46.3% [3] - 2024年中国市场前两大参与者合计占94.4%市场份额,其余市场相对分散,中国企业整体合并市场份额预计将从2024年的约20%增长至2029年的约60% [3] - AI大模型催生指数级算力需求,国产AI芯片厂商在技术、产品和供应上取得较大进展,叠加全球贸易环境不稳定,有望加速国内智算供应链自主化进程 [3] - 国产GPU的竞争维度已从“单卡算力”扩展至“集群可用、生态可迁移、标准可定义”的系统性层面 [1][8]
TPU vs GPU:谷歌芯片商业化提速,英伟达护城河能防得住吗?
华尔街见闻· 2025-12-03 15:21
核心观点 - 谷歌自研的AI芯片TPU正从内部工具转变为面向市场的英伟达GPU替代方案,对英伟达的市场主导地位构成实质性挑战 [1] - 竞争的关键在于系统级设计、软件生态、成本结构与商业模式,而不仅是单芯片性能 [2][3][8] 市场格局与竞争态势 - 全球最先进的两个AI模型(来自谷歌和Anthropic)完全或部分使用谷歌TPU开发,促使英伟达大客户Meta考虑使用TPU [1] - TPU的角色已从“谷歌内部工具”升级为大型AI公司可考虑的替代方案,任何客户“试水”都可能被市场放大 [1][2] - 摩根士丹利分析,谷歌计划2026年生产超过300万片TPU,2027年约500万片,英伟达当前GPU产量约为TPU的三倍,差距正在缩小 [1][7] 性能与系统设计 - 最先进的TPU(Ironwood)在每秒浮点运算次数(FLOPS)上约为英伟达Blackwell GPU的一半 [3] - 谷歌的策略是通过“集群化”放大优势,数千颗TPU可串联成“超级Pod”,在训练超大模型时具备出色的性价比与能效比 [3] - 英伟达单个系统最多直接连接约256颗GPU芯片,大模型时代系统级设计、互连能力和能效比成为新核心指标 [3] 软件生态与兼容性 - 英伟达的核心护城河是深度绑定的CUDA软件生态,对已使用CUDA的客户而言,租用英伟达芯片更具成本效益 [4] - TPU仅能与TensorFlow等特定AI软件工具顺畅配合,而多数AI研究人员使用的PyTorch在GPU上运行效果更佳 [4] - 对Anthropic、苹果和Meta等技术水平较高的客户,使用TPU挑战较小,TPU在运行谷歌Gemini模型时成本效率尤其突出 [4] 成本结构与盈利能力 - 在制造成本上,TPU与GPU相差不大,Ironwood使用了更先进、更昂贵的制程,但芯片体积更小,部分抵消了成本劣势 [5] - 博通从TPU项目中获得的收益至少达到80亿美元 [5] - 英伟达当前的硬件业务毛利率高达63%,而谷歌云整体只有24%,这解释了英伟达在价格战中仍保持极强盈利能力的原因 [6] 供应链与产能 - 台积电不会将所有产能押注在单一客户上,市场上始终会留出空间给包括TPU在内的其他方案 [7] - 当供应开始多元化,客户会更愿意比较、议价与分散风险 [7] 商业模式与战略意义 - 如果谷歌大规模对外销售TPU,需要重建包括服务器厂商、分销网络、企业级售后支持等整套产业链,近乎“复制一个英伟达” [8] - TPU未来可能不会走“低价路线”,而是通过其他费用弥补收入缺口,因为客户自建数据中心会减少谷歌云服务收入 [8] - TPU对谷歌的战略意义在于:成为与英伟达谈判的筹码、推广Gemini及其AI生态、在AI基础设施上拥有更大自主权 [8] - 只要客户愿意“多一个选项”,英伟达就不再拥有绝对定价权 [8]
谷歌TPU助力OpenAI砍价三成,英伟达的“王座”要易主了?
36氪· 2025-12-02 16:19
公司战略转变 - 谷歌TPU战略从主要服务内部AI模型转向积极向第三方销售芯片,直接与英伟达竞争 [1] - 公司通过谷歌云平台向外部客户提供TPU,并作为商业供应商销售完整TPU系统,以成为差异化云服务提供商 [2] - 与Anthropic达成的合作是公司外部战略的标志性一步,涉及直接销售硬件和通过云平台租赁两种方式 [2][3] 重要客户与合作 - Anthropic成为谷歌TPU首批重要客户,交易涉及约100万颗TPUv7芯片 [1][3] - 交易分配为:博通直接向Anthropic出售内含40万颗TPUv7芯片的成品机架,价值约100亿美元 [3] - Anthropic还将通过谷歌云平台租用另外60万颗TPUv7芯片,预计产生约420亿美元履约价值,占GCP第三季度新增订单积压490亿美元的大部分 [3] - 谷歌在早期对Anthropic进行了积极投资,并设定了15%的股权上限以扩大TPU外部应用 [2] 技术规格与成本优势 - TPUv7 "Ironwood"在理论算力(FP8 TFLOPs达4,614)和内存带宽(7,380 GB/s)上已接近英伟达Blackwell架构产品 [5][6] - 对谷歌而言,每颗TPU的总拥有成本比英伟达GB200低约44% [6] - 即使对外部客户,每个有效计算单元的成本仍可能比英伟达系统低30%-50% [6] - 谷歌系统支持将9,216颗芯片互联为统一计算域,而英伟达系统通常只能连接64到72颗芯片,在分布式AI训练中更具扩展性 [8] 市场影响与竞争格局 - OpenAI凭借转向TPU或其他替代方案,在与英伟达的谈判中获得了约30%的价格折扣 [1] - TPU已成为顶级AI模型的首选,谷歌Gemini 3 Pro和Anthropic Claude 4.5 Opus主要依托TPU和亚马逊Trainium芯片训练 [4] - 分析预测谷歌云未来几个季度有望与Meta、OpenAI等更多AI巨头达成类似交易 [3] 软件生态与部署模式 - 谷歌正加大投入消除软件兼容性制约,开发对PyTorch框架的原生支持并集成vLLM等推理库,目标是不要求开发者重构整个工具链 [10][12] - 公司采用创新融资模式,与Fluidstack等云服务商及TeraWulf等加密矿企合作,谷歌常担任财务保障角色以快速转型现有设施为AI算力设施 [12] 未来竞争与风险 - 英伟达正筹备在2026到2027年推出"Vera Rubin"芯片,采用HBM4内存等激进设计 [13] - 谷歌的应对策略是TPUv8双线开发,但项目已有延迟,且未积极采用台积电2nm工艺或HBM4内存等前沿技术 [13] - 若英伟达成功实现Rubin芯片性能提升,TPU现有的价格优势可能不复存在,其系统甚至在谷歌内部工作负载中可能比TPUv8更具经济效益 [13]
SemiAnalysis深度解读TPU--谷歌(GOOG.US,GOOGL.US)冲击“英伟达(NVDA.US)帝国”
智通财经网· 2025-11-29 17:37
行业竞争格局变化 - 谷歌TPU的全面商业化使英伟达在AI算力市场的定价权出现松动,其高达75%的毛利率面临挑战[1] - 谷歌从云服务商转型为直接向外部出售高性能芯片与系统的商用芯片供应商,Anthropic的采购标志着这一战略转变[1][4] - 谷歌TPU已获得包括Anthropic、Meta、SSI、xAI等顶级AI实验室的采购意向,客户名单不断扩大[4][29] 具体交易与成本优势 - Anthropic确认将部署超过100万颗TPU,交易总价值巨大,其中首批40万颗TPUv7由博通直接出售给Anthropic,价值约100亿美元,剩余60万颗通过谷歌云租赁,涉及剩余履约义务高达420亿美元[4][42] - 谷歌TPUv7在总拥有成本上对英伟达构成显著优势,从谷歌内部视角看,TPUv7服务器的TCO比英伟达GB200服务器低约44%,即便加上利润,外部客户通过GCP使用TPU的TCO仍比购买GB200低约30%[7][64][67] - 具体成本数据显示,GB200 NVL72每小时每GPU总成本为2.28美元,而TPU v7外部版本为1.60美元,TPU在每FP8 PFLOP的TCO上优势明显[66] 技术系统与架构优势 - 谷歌通过极致的系统设计弥补单芯片理论算力的不足,TPUv7采用3D Torus拓扑结构和自研光互连技术,单个集群可扩展至9,216颗芯片,远超英伟达常见集群规模[12][15][17] - 光路交换机技术允许动态重构网络拓扑,实现毫秒级故障绕过和高可用性,同时降低功耗和延迟[15][17][101] - 系统级优势使得TPU在实际模型训练中实现更高的算力利用率,有效FLOPs可能超过英伟达Blackwell[69][72] 软件生态战略调整 - 谷歌积极拥抱开源,软件团队KPI从服务内部转向支持外部,全力支持PyTorch Native在TPU上运行,降低开发者迁移门槛[19][20][141] - 通过XLA编译器直接对接PyTorch的Eager Execution模式,并向vLLM、SGLang等开源推理框架贡献代码,提升TPU在开源生态中的兼容性[20][145][146] - 软件生态的开放旨在填平英伟达的CUDA护城河,为外部客户提供更平滑的过渡体验[22][142] 金融与商业模式创新 - 谷歌创新性地提供资产负债表外的信贷支持,承诺为中间商的数据中心租金兜底,解决了AI基础设施建设的期限错配问题,打通了加密货币矿工与AI算力需求之间的堵点[9][43][46] - 这种“超大规模厂商兜底”的金融工具成为Neocloud市场的新融资标准模板,推动了行业增长[46][47] - 在定价策略上,谷歌通过平衡自身盈利和客户竞争力,即使作为外部供应商,其TPU交易的息税前利润率仍优于许多大型GPU云交易[79][80]
31省公布出生率数据,保时捷前三季利润暴跌99% | 财经日日评
吴晓波频道· 2025-10-28 10:15
中美经贸磋商 - 中美双方在马来西亚吉隆坡举行经贸磋商 围绕美对华海事物流和造船业301措施、延长对等关税暂停期、芬太尼关税和执法合作、农产品贸易、出口管制等议题进行坦诚深入交流 达成基本共识 [2] - 美国此前向中国征收20%的额外关税 对双方生产贸易带来极大干扰 [2] - 中国在大豆进口、TikTok运营、关键矿物出口等美国民众关心的事情上释放善意信号 美国初步表示愿意降低部分不合理关税 [3] 中国规上工业企业利润 - 1—9月份全国规模以上工业企业实现利润总额53732.0亿元 同比增长3.2% 较1—8月份加快2.3个百分点 [4] - 9月份规模以上工业企业利润同比增长21.6% 较8月份加快1.2个百分点 私营企业利润增长5.1% 外商和港澳台投资企业利润增长4.9% [4] - 1—9月份规模以上工业企业营业收入102.08万亿元 同比增长2.4% 营业收入利润率为5.26% 同比提高0.04个百分点 [4] - 制造业实现利润总额40671.8亿元 增长9.9% 电力、热力、燃气及水生产和供应业实现利润总额6691.0亿元 增长10.3% [4] 中国人口出生率 - 2024年全国出生人口为954万人 比2023年增加52万人 人口出生率为6.77‰ 提升0.38个千分点 [6] - 10个省份人口出生率超过8‰ 包括西藏、宁夏、贵州、青海、新疆、海南、广东、云南、广西和甘肃 [6] - 广东2024年出生人口达113万人 连续7年成为第一生育大省 连续5年成为唯一出生人口超100万的省份 [6] - 去年出生人口最多的10个省份合计占全国出生人口比重达58.6% [6] 新能源汽车行业 - 明年新能源汽车购置税减免政策将转为减半征收 每辆新能源乘用车减税额不超过1.5万元 [8] - 奇瑞汽车、小米汽车等至少10家品牌宣布推出跨年购置税补贴方案 小米此次购置税兜底投入将超20亿元 单辆车最高补贴金额不超过1.5万元 [8] - 部分新能源车品牌交付周期较长 小米等车企提车周期动辄需要二三十周 [8] 互联网本地生活行业 - 美团计划启动公司有史以来最大规模常规债券发行 寻求筹集约30亿美元资金 包括约20亿美元美元票据和等值10亿美元离岸人民币票据 [10] - 美团二季度为应对京东在外卖行业竞争 净利润基本清零 三季度阿里加入战局后双方推出力度空前补贴活动 [11] - 阿里正将触手伸到即时零售 未来可能在本地生活领域全面加码 [11] 汽车制造业 - 保时捷前三季度销售利润仅为4000万欧元 较去年同期40.35亿欧元下降99% 第三季度亏损达9.66亿欧元 [12] - 保时捷前三季度营业收入268.6亿欧元 同比下降6% 中国市场销量同比下滑26%至3.2万辆 [12] - 保时捷计划在未来几年内裁员1900人 并于今年内裁减2000个临时岗位 [12] 科技投资与人工智能 - 软银董事会批准对OpenAI的第二笔225亿美元投资 这是今年4月软银承诺400亿美元投资的最新进展 [14] - 软银已通过贷款和债券筹集至少240亿美元资金 今年4月在日本发行6000亿日元债券 为日本有史以来规模最大的债券发行之一 [14] 中国股市 - 10月27日沪指涨1.18%报3996.94点 再创十年新高 盘中逼近4000点 深成指涨1.51% 创指涨1.98% [16] - 沪深两市成交额2.34万亿元 较上一个交易日放量3659亿元 超3300家个股上涨 [16] - 存储芯片概念股全天走强 算力硬件概念股延续强势 核电板块表现活跃 [16]
大疆和影石终于“华山论剑”,谁会成谁的「垫脚石」?
36氪· 2025-07-11 11:25
行业竞争格局 - 影石在全球全景相机市场占据绝对主导地位,2023年市占率达67.2%,领先于日本理光(12%)和美国Go Pro(9%)[4] - 大疆在运动相机领域2024年预计销量100万台,收入20-30亿元,位列第二;影石非全景运动相机收入约15亿元,排名第三[5] - 大疆Osmo 360即将发售,将与影石Insta360 X5正面对决,双方在渠道和产品层面的竞争加剧[14] 公司产品与技术 - 影石产品线涵盖消费级和专业级智能影像设备,消费级产品贡献86.59%营收,ONE X系列是销量主力[2] - 影石核心壁垒在于软件生态,包括隐形自拍杆算法、FlowState防抖算法、六轴陀螺仪、AI剪辑等技术[17] - 大疆基于无人机技术积累,将云台稳定技术复用于Osmo Pocket系列,并构建手持影像生态系统闭环[15][17] - 影石研发投入持续超营收12%,研发团队占比46.3%,正拓展无人机和智能影像机器人产品线[23] 销售渠道与营销策略 - 影石2024年线上线下销售占比接近1:1,线上官网占18.81%,第三方电商24.39%,线下经销44.37%[6] - 线下渠道覆盖Best Buy、顺电、山姆等连锁商超,海外采用买断式销售模式应对专业用户需求[9] - 影石营销策略以KOL为核心,57%投放资源倾斜腰部和初级达人,成功打造多起病毒式传播案例[10][11] - 大疆此前忽视营销,2024年开始大幅增加预算,与影石争夺3C领域KOL资源[14] 供应链与芯片依赖 - 影石2024年芯片采购占原材料成本28.82%,主要依赖安霸和索尼芯片,可替代性差[25] - 高端DSP芯片仍由安霸、高通、TI等海外品牌主导,国产芯片存在技术差距[24] - 大疆凭借自研能力在芯片供应上更具优势,可能分流影石中端用户[25] 产品创新与市场趋势 - 影石独创"先拍摄后取景"功能,大疆通过折叠设计和哈苏CMOS提升航拍画质[15] - 行业缺乏划时代创新,多数企业聚焦参数升级而非突破性产品[15] - 全景相机和运动相机开辟新市场空间,带动行业进入新一轮竞争[1]