超节点
搜索文档
计算机行业深度:国产ASIC:PD分离和超节点—ASIC系列研究之四
申万宏源证券· 2025-09-29 09:54
核心观点 - ASIC芯片在AI推理侧的成本效益优势显著,能效比和成本降低表现突出,市场规模增长迅速,2028年全球AI ASIC市场规模有望达1250亿美元[5][6] - 国产ASIC发展呈现PD分离和超节点两大趋势,头部云厂商自研成果显著,国产设计服务商在产业链成熟与需求增长共振下有望放量[13][15] - 小核酸药物市场从罕见病向常见病领域加速扩容,2033年全球市场规模预计达467亿美元,国内企业聚焦心血管等大病种研发[14][17] - 国产算力生态持续完善,GPU厂商沐曦股份累计出货2.5万颗芯片,2024年中国AI芯片市场规模超270万张[16][17] - 风电行业盈利修复趋势明确,2025年6月风机投标均价同比提升10.3%,海风市场预期共振推动估值切换[22][23] 行业表现数据 - 主要指数表现:上证指数下跌0.65%,深证综指下跌1.54%;风格指数中大盘指数近6个月涨幅16.84%,小盘指数涨幅17.2%[2] - 涨幅居前行业:化学纤维(昨日+3.08%,近6个月+12.99%)、风电设备(昨日+2.67%,近6个月+33.05%)、动物保健(昨日+2.06%,近6个月+24.03%)[2] - 跌幅居前行业:消费电子(昨日-4.79%,近6个月+47.38%)、元件Ⅱ(昨日-4.5%,近6个月+75.89%)、游戏(昨日-4.01%,近6个月+67.02%)[2] ASIC芯片行业 - ASIC与GPU技术边界趋同但商业模式差异显著:ASIC为专用芯片聚焦特定推理场景,GPU需覆盖全场景通用需求[5][15] - 成本优势验证:谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU降低40%,推理成本降55%[5][15] - 头部厂商增长强劲:博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达[5][15] - 推理需求驱动市场:ChatGPT C端WAU达7亿,OpenRouter的Token消耗量近一年增长近10倍,外采芯片需承担厂商高额利润(英伟达FY2025净利率57%)[6][15] - 设计服务商格局:博通和Marvell份额领先,博通凭借30亿美元IP投入、TPU设计经验及3.5D封装技术建立壁垒[6][15] 国产ASIC发展 - 云厂商自研进展:百度昆仑芯第三代实现万卡集群部署并中标10亿元中国移动订单;阿里平头哥PPU显存带宽超英伟达A800,签约中国联通16384张算力卡订单;字节计划2026年前量产自研芯片[15] - 国产服务商优势:芯原股份具备5nm工艺能力,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程[15] - 技术趋势:PD分离(华为异腾950分PR/DT型号适配不同场景)、超节点(海光开放HSL协议,华为灵衢总线支持8192卡扩展)[15] 小核酸药物行业 - 技术优势:研发周期短、靶点丰富、效果持久,直接作用于mRNA层面靶向"不可成药"靶点[14] - 市场规模:全球从2019年27亿美元增长至2023年46亿美元(CAGR 14.3%),预计2033年达467亿美元(CAGR 26.1%)[17] - 研发方向:海外聚焦罕见病向常见病跨越,国内直接切入心血管、乙肝、癌症等大病种[17] - 重点企业:国内关注瑞博生物、圣诺医药、舶望制药等,海外龙头包括Alnylam、Ionis、Arrowhead[17] 国产算力与GPU - 市场规模:2024年中国加速芯片市场规模超270万张,本土品牌AI芯片出货量超82万张,GPU市场规模约1000亿元,ASIC/DSA芯片规模约425亿元[17] - 生态建设:Deepseek V3.1引入FP8精度适配国产芯片,阿里未来三年计划投入超3800亿元用于AI算力,字节2025年算力采购预算约900亿元[17] - 沐曦股份:累计出货2.5万颗GPU,2023-2025年主力产品曦云C500系列收入从1547万元增长至3.1亿元(2025Q1),占主营业务收入97.87%[17] 其他重点行业 - 风电行业:风机投标均价1616元/千瓦(同比+10.3%),2026年欧洲海风装机量预计8.7GW(同比+107%),主机环节盈利弹性突出[22][23] - 万国数据:全球IDC巨头,25H1营收56.23亿元(同比+12.4%),在建IT功率379MW,储备资源900MW,境外DayOne板块在建+储备超1200MW[21][23] - 新疆众和:铝电子材料全产业链布局,新建240万吨氧化铝项目预计2026年投产,依托港口区位降低运输成本[18][20] - 紫光国微:股权激励覆盖466名核心骨干,要求2025-2028年净利润较2024年增长10%/60%/100%/150%,对应CAGR 25.7%[25][27][29]
华尔街见闻早餐FM-Radio | 2025年9月29日
华尔街见闻· 2025-09-29 07:00
宏观经济与政策 - 中国央行强调落实适度宽松的货币政策,用好互换便利和股票回购增持再贷款等工具,重点在于释放已出台政策的效应 [4][11] - 中国8月规模以上工业企业利润同比大增20.4%,创2023年12月以来最高增速,扭转了7月下滑1.5%的势头,其中装备制造业和原材料制造业利润增长显著 [4][11] - 美国8月核心PCE物价指数环比增长0.2%符合预期,同比涨幅维持在2.9%,消费支出连续三个月增长,显示出韧性 [12] - 韩国已与美国就外汇问题达成一致,美方认为韩国不符合汇率操纵国认定标准 [25] - 欧盟宣布立即恢复对伊朗核相关制裁,伊朗方面指责此举非法且毫无根据 [5][16] 行业动态与趋势 - 沃尔玛CEO表示AI将改变所有岗位,公司计划未来三年维持210万员工总数不变,但岗位构成将进行重大调整 [6][16] - 高盛指出欧美电网老化已成为AI发展的“关键瓶颈”,预计到2030年电网建设将推动60%的全球铜需求增长,铜将变成“新的石油” [18] - 存储行业缺货情况严峻,DRAM及NAND闪存价格预计在四季度及2026年进一步上升,威刚已停止DDR4报价,群联NAND闪存控制芯片报价涨幅约10% [29] - 中国移动、浪潮信息等30多家企业联合发布“北京方案”,旨在通过超节点创新联合体开发面向特定场景的“行业智能体” [30] - 全球首个星座级太空AI算力服务在中国进入常态化运营阶段,国星宇航的太空计算星座具备5POPS处理能力 [31] 公司动态与业绩 - 英特尔股价上涨超4%,报道称其与台积电和苹果讨论投资事宜 [2] - 波音股价上涨3.6%,领涨道指,因美监管方FAA将放宽737 MAX交付限制,并可能允许其月产量从38架提升至42架 [2][27] - 特斯拉股价反弹4% [2] - 理想汽车发布纯电车型i6,起售价24.98万元,CLTC续航720公里,并持续扩大自营超充站网络 [18] - 小米股价下跌8%,公司强调已放弃速胜,正从互联网公司转型为硬核科技公司,未来5年将投入2000亿元研发费用 [2][21] - 游戏巨头EA可能被私有化,估值达500亿美元,交易由银湖资本、沙特PIF等组成的财团主导,股价收涨近15%至历史新高 [27] - 微软被摩根士丹利上调为“首选”,目标价625美元,分析认为其与OpenAI的合作关系仍在演进,增长核心是Azure云服务 [27] - 苹果正在内部测试代号为“Veritas”的类ChatGPT应用,为Siri重大升级做准备 [26] - 因宁德时代宜春锂矿停供原料,龙蟠时代已于9月25日停产,大部分员工已放假,可能11月才正式复产 [6][18] 科技与创新 - 英伟达CEO黄仁勋表示,OpenAI很可能成为下一个万亿美元级别的公司,未来5年内AI驱动的收入将从1000亿美元增至万亿美元级别 [17] - 国产GPU公司摩尔线程IPO成功过会,成为国产GPU第一股,计划募资80亿元,2025年上半年营收达7.02亿元,毛利率升至70.71% [17] - 清华大学团队成功开发出一种新型含氟聚醚电解质,为高安全性、高能量密度固态锂电池的开发提供了新思路 [29] - OpenAI被曝未经用户同意将付费账户的模型“降配”至低算力模型,引发用户对透明度的质疑 [17] 地缘政治与贸易 - 特朗普芯片新政要求生产商国内产量与进口达到1:1比例,未达标将征收关税,这可能对苹果、戴尔等大型科技企业构成挑战,但使台积电、美光等在美增产企业受益 [4][13] - 白宫澄清特朗普宣布的100%药品进口关税将不适用于与美国有贸易协议的欧日等国,相关关税上限为15% [4][12] - G7内部对是否就所谓“安全风险”对中国稀土产品征税存在分歧,除日本外,G7各国在关键材料上高度依赖中国 [19] - 特朗普对俄罗斯石油买家的施压推升了原油市场的担忧情绪,油价收创近两月新高,全周涨超5% [24]
超节点技术与市场趋势解析
傅里叶的猫· 2025-09-29 00:00
超节点领域的合作与方案 - 下游CSP大厂主要找服务器供应商定制整机柜产品 服务器厂商和国产GPU厂商也在规划自己的超节点机柜 但以NV方案为主[4] - 国内主流超节点方案包括腾讯ETH-X、NV NVL72或其变形、华为昇腾CM384、阿里磐久 这些已在市场推广或有客户购买 字节规划大模型以太网创新方案 以博通Tomahawk为主 还未推广 海光方案多为传统刀片式服务器 无类似创新方案[4] - ETH-X是腾讯开放生态 与博通、安费诺等电缆和PCIe厂商合作 主要推广方包括壁仞、壁仞华创和腾讯下游云公司 在甘肃庆阳数据中心有合作 使用博通Tomahawk作为交换机 PCIe switch处理GPU流量 安费诺处理静态通信 中航光电设计液冷散热[5] - 字节方案由华擎研发 与腾讯类似但GPU卡不同:腾讯用燧原S60、L600及未来卡 字节用寒武纪和自研ASIC卡 两者适配天数、沐曦、摩尔线程等国产GPU 但主GPU各有侧重[5] - 互联网大厂自研方案与华为384、海光96卡、摩尔跨柜方案本质不同在于应用偏向:CM384偏训练和大模型计算 腾讯ETH-X偏推理 字节大模型整机柜偏训练和高性能计算[5] - 服务器厂商需具备交换机和服务器开发能力 与博通、NV、国产GPU厂商有关系 在AI服务器8卡、16卡、32卡方案有市场占有度 才能进入CSP选型 目前入选供应商有华勤、华三、超聚变 浪潮和锐捷作为备用 海光独立生态[5] 市场占有率与供应商格局 - 超节点方案还未大规模占有市场 在传统AI服务器(8卡、16卡)中 浪潮占有率最高 其次H3C 再是宁畅、华勤 国产开放生态中 昇腾达80%-90%[6] - 从9月16日起 CSP大厂包括BAT被强制不能采购NV的合规卡 明年或后年国产卡需达30%-40% 目前比例约9:1和8:2 互联网厂商每年被约谈 但海外卡采购仍放大[6] - 字节今年海外:国内=8:2 明年升至6:4 阿里找华勤等在海外代做NV方案 已招标提供海外数据中心 阿里、字节、腾讯通过下游云公司代建计算中心 非直接持有 代建后签3-5年租赁协议[6] - 中兴通讯2025年高层调整 新郭总目标在阿里、字节占份额 目前在阿里AI服务器从末尾升至20%-25% 联想因盈利考核 在CSP份额低 字节10% 阿里腾讯个位数 2024-2025价格战参与低[6] - 阿里AI服务器份额:浪潮33%-35% 华勤23% 宁畅和华三各18% 通用服务器:浪潮30% 中兴27% 华勤18% 华三15%[7] - 腾讯AI服务器:华勤40% 浪潮23% 华三18% 通用:浪潮35% 超聚变30% 宁畅15%[7] - 字节AI和通用:浪潮和宁畅各35% 宁畅AI30%、通用28% H3C AI15%、通用18% 联想10% 英业达和富士康各5%[7] 厂商竞争与二线格局 - 浪潮在成本和报价竞争激进时总拿第一份额 最具竞争力 第二第三竞争不明朗 阿里中是中兴、华三、华勤 华勤成本弱但高层决策以份额为主 盈利次之 数据业务盈利率降[8] - 腾讯AI服务器研发标多给华勤 技术30%、报价50%、质量20% 故份额高 通用中超聚变主攻腾讯 报价商务积极 华勤份额基本0 字节浪潮和宁畅默契 第一第二[8][9] - 大厂浪潮优势:在字节2019自研ODM起步时支持最大 技术供应服务商务占优 在阿里腾讯靠报价[9] - 二线互联网厂商需求小 无规则 主流供应商不参与 美团只华三和超聚变合作 京东直接采买超聚变和浪潮 只有浪潮和超聚变等成本强厂商占比例 美团基本浪潮和超聚变份额[9] - 二线GPU厂商找服务器厂商共研超节点 因无华为海光生态优势、销售人员少、对玩法不熟 服务器厂商有渠道 二线GPU可借其客户生态 国际厂商有供应品牌优势 客户认可规范GPU[9] - 华为UBB模式互联和海光HL总线协议只限各自生态 非开放 目前CPU无强制 大家是否用华为或海光CPU不确定[9] - 国产服务器发展慢 AI生态迭代国外领国内一年 互联网领行业一年 国外800G刚批量 国内2026Q4兴起 行业2027年[9] 采购与自研芯片 - 腾讯阿里能买时偏NV卡 阿里平头哥:NV=3:7 字节NV:国产=7:3(前8:2) NV限购时 以租代购和带采解决开支需求 资本开支用不完时 有趋势挪到国产[10] - 阿里平头哥3.0对标A100 80% 字节ASIC推理对标H100 65%-70% H100更训 百度昆仑芯未详 平头哥4月前代工台积电 4-6中断、7恢复8停 后中芯国际 海外三星 合作伙伴浪潮和华擎[10] - 超节点趋势:国外业务模型数据千万级 单节点不满足、时延高 故扩8卡到64卡增算力减时延 国内未铺开 未来推理若数据增长单节点不足 或有大规模需求[10] - 国产GPU合作:浪潮和中兴主 沐曦华三华勤 燧原开放 超聚变负责 摩尔线程H3C浪潮多[10] 经济与技术方面 - 以华勤为例 AI服务器净利率1-2点 大厂毛利率7-8点 通用毛利率1-2% 无净利率 通用规模小 牺牲成本占市场 成本强厂商净利率最好5点[11] - 未来AI超节点后 净毛利升 从自控物料入手:单机100万 自控10万 低毛净 整柜两三百万 自控压上游价 增利润 加软件方案 提升附加值[11] - 软件方案:1000万超节点 软件增三四十万利润 若供应商能力足、CSP评估费用低于自研 由供应商做 主要担运维管理[11] - 超节点CPU比例升:至少16节点 每节点2CPU 共32 以384方案:2CPU+4GPU 与72方案(18节点36CPU)区别大 铜缆比例增 核心厂商安费诺和立讯[11]
国产 ASIC:PD 分离和超节点:ASIC 系列研究之四
申万宏源证券· 2025-09-26 21:28
投资评级 - 报告对国产ASIC行业持积极看法,认为ASIC设计服务商迎来发展机遇,博通、Marvell、国内芯原股份、翱捷科技、灿芯股份有望受益 [2] 核心观点 - ASIC在能效与成本上优势突出,专用芯片特性使其在推理场景更具优势,AI渗透率提升带动推理需求激增,拓宽ASIC市场空间 [1][3] - ASIC设计复杂度高,专业分工下设计服务商价值凸显,博通等头部服务商凭借完整IP体系、封装技术和量产经验巩固行业地位 [1][3] - 国内云厂商自研ASIC已有独立成果,并非跟随海外路径,百度、阿里、字节等头部厂商推动国产ASIC放量,本土设计服务商迎来战略机遇 [1][3] - PD分离与超节点成为国产ASIC发展的两大核心趋势,华为、海光等厂商已形成自主技术体系,采用开源开放模式适配多元化需求 [1][4] 目录总结 大模型推理带动ASIC需求 - 2028-2030年全球AI芯片市场规模有望达5000亿美元,AI基础设施支出预计达3-4万亿美元 [8] - ASIC专用性强,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU降低40%,推理成本降55% [14][15] - 推理需求激增驱动ASIC需求,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量一年翻近10倍 [21][29] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,AMD预计2028年全球AI ASIC市场规模达1250亿美元 [1][30] ASIC设计复杂度高,服务商价值凸显 - ASIC设计需前端需求定义与后端技术落地,云厂商多依赖服务商,博通、Marvell为全球主要服务商 [36][41] - 谷歌TPU成功离不开与博通合作,博通优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术、高速互联与CPO技术 [1][55] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [1][55] 国内ASIC发展并非跟随 - 2025H1中国AI云市场CR5超75%,头部云厂需求旺盛,百度昆仑芯迭代至第三代,实现万卡集群部署并中标10亿元中国移动订单 [1][74][75] - 阿里平头哥PPU显存容量96GB、带宽700GB/s超英伟达A800,签约中国联通16384张算力卡订单 [76][78] - 字节2020年启动芯片自研,计划2026年前量产,国产服务商芯原股份、翱捷科技、灿芯股份各具优势 [1][80][82] 国产ASIC技术趋势:PD分离与超节点 - PD分离指Prefill与Decode任务用不同芯片完成,华为昇腾950分PR和DT型号适配不同场景 [1][94][95] - 超节点通过高带宽互联形成统一计算体,海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展 [1][104][107] - 英伟达Rubin CPX为海外首个芯片级PD分离实践,采用GDDR7替代HBM降低成本,华为昇腾950PR/950DT分别针对Prefill和Decode优化 [90][92][95]
ASIC系列研究之四:国产ASIC:PD分离和超节点
申万宏源证券· 2025-09-26 20:46
报告行业投资评级 - 看好 [2] 报告核心观点 - ASIC专用芯片在AI大模型推理阶段具备显著成本效益优势,能效比和单位算力成本表现突出,验证了其商业化拐点 [3] - AI渗透率提升推动推理需求激增,Token消耗量近一年翻近10倍,驱动ASIC市场空间扩大,预计2028年全球AI ASIC市场规模达1250亿美元 [3][31][32] - ASIC设计服务商在产业链中价值凸显,博通等头部服务商凭借完整IP体系、先进封装技术和量产经验获得持续订单,国内厂商如芯原股份、翱捷科技、灿芯股份迎来发展机遇 [3][60][89][90] - 国产ASIC发展呈现PD分离和超节点两大趋势,华为昇腾950分型号适配不同场景,海光、华为构建开放互联生态,区别于海外封闭路径 [3][99][107][115] 大模型推理带动ASIC需求 - ASIC与GPU技术边界趋同,但商业模式差异显著:ASIC为下游场景高度耦合的专用芯片,GPU需覆盖多场景属通用芯片 [3][14][15] - ASIC能效比优势突出,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU方案降低40%,推理成本降55% [3][18] - 自研ASIC可显著降低TCO,外采芯片需承担厂商利润,英伟达FY2025净利率达57%,其数据中心AI芯片收入1022亿美元 [3][21] - 推理需求激增驱动ASIC放量,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量从2024年9月不足0.5T提升至2025年8月接近5T [3][25][31] ASIC设计复杂度高,服务商价值凸显 - 谷歌TPU成功离不开与博通合作,博通核心优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术及高速互联能力 [3][59][60][69] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [3][60] - 芯片设计连贯性带来高客户转换成本,服务商壁垒稳固,头部云厂如谷歌、亚马逊、Meta、微软均依赖博通、Marvell等专业服务商 [3][44][60][75] - 国内设计服务商各具优势:芯原股份具备5nm工艺能力和丰富IP积累,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程 [3][89][90][91] 国内ASIC发展机遇 - 2025H1中国AI云市场CR5超75%,头部云厂自研ASIC成果显著:百度昆仑芯实现万卡集群部署并中标10亿元中国移动订单,阿里平头哥PPU显存带宽超英伟达A800并签约16384张算力卡订单,字节计划2026年前量产自研芯片 [3][78][83][84][87] - 国产ASIC服务商覆盖不同技术需求,芯原股份2024年芯片量产收入8.6亿元、芯片设计7.2亿元、IP授权7.4亿元,灿芯股份芯片量产收入8.1亿元 [3][91] - SerDes等关键IP国产化加速,国内厂商如芯潮流、晟联科、集益威已布局56Gbps-112Gbps产品,但224Gbps仍依赖海外 [3][95] 国产ASIC技术趋势:PD分离与超节点 - PD分离成为推理场景主流趋势,Prefill任务计算密集型,Decode任务内存带宽受限,华为昇腾950分PR和DT型号适配不同场景 [3][97][99][107] - 英伟达Rubin CPX专为Prefill优化,采用GDDR7替代HBM降低成本,预计2026年底上市 [3][99][103] - 超节点通过高带宽互联整合多处理器,国内海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展,均采用开源开放模式 [3][109][115][117] - 华为昇腾950PR采用自研低成本HiBL 1.0 HBM,950DT采用HiZQ 2.0 HBM,内存带宽达4TB/s,互联带宽2TB/s [3][107]
阿里云栖大会第一日——超节点
小熊跑的快· 2025-09-24 12:38
阿里云超节点架构 - 大模型训练推理对显存容量和带宽需求增长 传统GPU单机8卡方案无法满足业务需求[4] - 超节点解决方案采用多卡组成 具备大容量显存和低延迟共享特性[4] - 超节点设计基于高密度集成的PPU芯片 充分发挥芯片设计优越性[6] UALink互联协议 - 超节点采用UALink协议 联盟成员包括AMD AWS Google Intel Meta Microsoft等[5] - AMD贡献Infinity Fabric协议促成联盟成立 阿里云加入该联盟[5] - 协议针对行业自有技术演进成本高问题 提供开放互联方案[5] 硬件性能参数 - PPU配备96GB HBM2e显存 高于A800的80GB 与H20容量一致[10] - 片间互联带宽达700GB/s 远超A800的400GB/s 略低于H20[10] - 支持PCIe 5.0×15接口 优于A800的PCIe 4.0×16 与H20同代[10] - 功耗400W与A800相同 低于H20的550W[10] - 基础版峰值算力120TFLOPS专注AI推理 高级版支持AI训练[10] 网络与拓扑架构 - ALS-D系统在UALink上补充在网计算加速特性 支持Switch组网模式[9] - 采用基于Switch硬件连接方案 支持单层和二层互连拓扑[9] - 可扩展至数百/数千节点互连 满足并行计算发展需求[9] 系统集成方案 - 超节点实现单机64卡配置 磐久机柜功率达300千瓦[9] - 采用铜线链接方案提升密度 对互联协议有特定要求[9] - 通过MoE技术提升模型表达能力 降低算力需求[8]
英伟达50亿美元“雪中送炭”,英特尔绝地求生?全球格局一夜生变,国产芯片如何突围
华夏时报· 2025-09-20 22:43
合作核心内容 - 英伟达以50亿美元注资入股英特尔 双方将共同开发多代定制化的数据中心及个人计算产品 [1] - 通过NVIDIA NVLink技术实现架构无缝互连 融合英伟达AI与加速计算优势及英特尔CPU技术与x86生态 [2] - 英特尔为英伟达定制x86处理器并集成至英伟达AI基础设施平台 同时推出集成NVIDIA RTX GPU芯粒的x86系统级芯片用于PC产品 [2] 合作背景与战略动机 - 20年前英特尔曾拒绝以200亿美元收购英伟达的提议 如今行业地位发生反转 [3] - 英特尔2025年第二季度财报显示营收129亿美元同比持平 净亏损29亿美元 需通过合作重获资本市场信心 [8] - 英伟达通过投资可弥补CPU短板 借助英特尔渠道拓展企业级和个人市场 同时防御微软、亚马逊、谷歌等云巨头自研芯片的威胁 [4] - 合作可应对AMD的CPU-GPU一体化平台竞争 通过"Intel CPU+Nvidia GPU"硬件架构提升AI计算平台性能 [4] 资本市场反应与政府参与 - 消息公布后英特尔股价一度涨近30% 收盘涨22.77%至30.57美元/股 总市值达1428亿美元 [6] - 英伟达股价涨3.49%至176.24美元/股 总市值达4.28万亿美元 [6] - 英特尔过去一个月获三笔投资:软银20亿美元(每股23美元) 美国政府89亿美元(每股20.47美元收购4.333亿股占9.9%) 英伟达50亿美元(每股23.28美元) [6] - 美国政府投资来自《芯片与科学法案》57亿美元补贴及32亿美元政府资助 成为被动持股大股东 [7] 对竞争对手的影响 - AMD股价收盘跌0.78%至157.92美元/股 总市值2563亿美元 ARM股价收盘跌4.45% [9] - 合作直接挑战AMD的CPU-GPU一体化平台 可能使AMD在未来被边缘化 [10] - 对ARM架构构成打击 英伟达在通算路线选择x86将削弱ARM在数据中心和超大规模应用中的替代价值 [9][10] 对中国半导体行业的影响 - 合作巩固美国在高端算力和数据中心芯片的垄断地位 加大中国厂商国际竞争难度 [11] - 促使中国加速自主创新 超节点路径成为破局关键 国产替代速度将加快 [11] - 华为发布Atlas 950/960 SuperPoD超节点 支持8192及15488张昇腾卡 算力集群规模达50万卡和百万卡 [12] - 壁仞科技、曦智科技、中兴通讯联合推出光跃LightSphere X超节点解决方案 计划实现数千卡规模商业化部署 [12] - 国产厂商通过分布式架构和互连创新构建不依赖CUDA的自主系统 但在训练市场仍难以突破英伟达生态护城河 [13]
「寻芯记」英伟达50亿美元“雪中送炭”,英特尔绝地求生?全球芯片格局一夜生变
华夏时报· 2025-09-19 21:03
合作核心内容 - 英伟达以50亿美元注资入股英特尔 双方将共同开发多代定制化的数据中心及个人计算产品[2] - 通过NVIDIA NVLink技术实现架构无缝互连 融合英伟达AI与加速计算优势及英特尔CPU技术与x86生态[3] - 英特尔为英伟达定制x86处理器并集成至AI基础设施平台 同时推出集成NVIDIA RTX GPU芯粒的x86系统级芯片[4] 合作背景与动因 - 英特尔获得英伟达资金和市场背书 股价应声上涨22.77%至30.57美元/股[5][6] - 英伟达通过投资补齐CPU短板 深化GPU与英特尔CPU整合 并借助英特尔渠道拓展市场[5] - 应对AMD的CPU-GPU一体化平台威胁 以及微软、亚马逊、谷歌等云巨头自研芯片的竞争压力[5] 英特尔近期资本动态 - 过去一个月获得三笔投资:软银集团20亿美元(每股23美元)、美国政府89亿美元(每股20.47美元收购4.333亿股)、英伟达50亿美元(每股23.28美元)[7] - 美国政府投资属于被动持股 不享有董事会席位及治理权 资金来自《芯片与科学法案》的57亿美元补贴和32亿美元政府资助[8] - 英特尔2025年第二季度营收129亿美元(同比持平) 净亏损29亿美元[8] 行业竞争格局影响 - AMD股价下跌0.78%至157.92美元/股 ARM股价下跌4.45%[9] - 合作对AMD的CPU-GPU一体化平台构成挑战 对ARM架构在智算芯片领域形成冲击[9][10] - 台积电股价未受显著影响 收盘上涨2.23%至268.64美元/股[9] 技术发展路径 - 摩尔定律趋近极限 行业转向通过工程技术提升计算架构整体效能[6] - 英伟达基于NVLink技术实现通算和智算在融合计算架构上的结合[6] - 超节点技术成为重要发展方向 通过系统级架构创新将大量计算芯片紧密耦合[11] 中国市场影响与应对 - 合作进一步巩固美国在高端算力和数据中心芯片的垄断地位[11] - 中国厂商加速自主研发 华为发布Atlas 950/960 SuperPoD超节点 支持8192及15488张昇腾卡[11] - 壁仞科技、曦智科技、中兴通讯联合推出光跃LightSphere X 计划实现数千卡规模商业化部署[12] - 国产芯片企业通过分布式架构和互连创新构建自主系统 聚焦推理市场与英伟达竞争[13]
科技风起:从昇腾迭代路线图看国产算力发展趋势
长江证券· 2025-09-19 10:42
报告行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][4][5][6][7][8][9][11][15][16][17][18][19][20][21][22][23][24] 报告核心观点 - 华为在2025年9月18日全联接大会上公布AI芯片、超节点和算力集群路线图 预计2026年第一季度推出昇腾950PR芯片 2026年第四季度推出昇腾950DT芯片 2027年第四季度推出昇腾960芯片 2028年第四季度推出昇腾970芯片 [8][11] - 华为发布最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD 分别支持8192张和15488张昇腾卡 [11] - 华为发布超节点集群Atlas 950 SuperCluster和Atlas 960 SuperCluster 算力规模分别超过50万卡和达到百万卡 [11] - 超节点正成为AI基础设施建设新常态 通过"超节点+集群"解决方案满足算力需求 [5][11] - 超节点带来互联需求提升、液冷价值量提升、系统解决方案升级和国产先进制程产能需求提升等产业影响 [5][11] 算力芯片迭代升级 - 华为昇腾AI芯片在算力性能、精度支持、向量算力、可编程性、内存容量、内存带宽、互联带宽、PD分离、自研HBM等方向均显著提升 [11] - 芯片生态进一步开放 追赶海外龙头厂商 [11] 超节点发展态势 - 超节点AI服务器算力密度和通信复杂度大幅提升 单节点功耗显著增加 [11] - 华为通过灵衢、UnifiedBus等互联协议消除关键瓶颈 更好支持大模型训练和推理 [11] - 国内半导体产业链加速推进国产技术迭代 先进制程工艺水平和产能规模持续提升 [11] 产业链投资机会 - 国产AI芯片领军企业寒武纪和国产高端CPU、DCU领军企业 [11] - 超节点服务器厂商如烽火通信和神州数码 [11] - 超节点配套链接厂商华丰科技、液冷厂商英维克和PCB厂商 [11] - 华为超节点相关合作伙伴 [11] - 半导体先进制造产业链如晶圆、封测、设备材料等供应商 [11]
2025华为全联接大会解读:昇腾铸芯、超节点织网,华为算力跃升新纪元
东北证券· 2025-09-19 10:41
行业投资评级 - 电子行业评级为"优于大势" [6] 核心观点 - 华为通过昇腾芯片与超节点产品实现系统级创新 在AI算力基础设施领域实现全面突破 为国产算力提供持续替代方案 [1][3] - 昇腾芯片保持"一年一代"迭代节奏 2025-2028年将陆续推出910C/950PR/950DT/960/970系列 算力与带宽性能持续提升 [1][14] - 超节点产品通过灵衢协议和UB-Mesh架构实现高可靠全光互联 覆盖从数据中心到企业级的多样化算力需求 [1][2][24] - 华为在HBM存储器、芯片架构设计和工艺技术方面实现自研突破 逐步补齐与行业龙头的性能差距 [3][15][21] 昇腾芯片产品线 - 昇腾910C已于2025Q1发布 提供800 TFLOPS@FP16算力和3.2TB/s内存带宽 [14][20] - 昇腾950系列将于2026年推出:950PR专注推理和推荐场景 配备1.6TB/s带宽HBM;950DT专注训练和解码场景 配备4TB/s带宽HBM [1][15][16] - 昇腾960计划2027Q4发布 算力、内存容量、内存带宽和互联端口均实现翻倍 达2 PFLOPS@FP8和9.6TB/s带宽 [18][20] - 昇腾970计划2028Q4发布 FP8算力进一步提升至4 PFLOPS 内存带宽达14.4TB/s [19][20] 超节点数据中心产品 - Atlas 900 A3 SuperPoD支持384卡互联 总算力300 PFLOPS 已部署超300套 [27] - Atlas 950 SuperPoD支持8192卡无收敛互联 算力达8 EFLOPS@FP8 互联带宽16.3 PB/s 性能达英伟达NVL144的6.7倍 [30][33] - Atlas 960 SuperPoD计划2027H2发布 支持15488卡互联 算力提升至30 EFLOPS@FP8 互联带宽34 PB/s [33] 超节点集群与企业级产品 - Atlas 950 SuperCluster由64个SuperPoD组成 总算力达524 EFLOPS@FP8(1 ZFLOPS@FP4) 网络时延降低23% 光模块数量减少26% [37] - 企业级风冷服务器Atlas 850支持8颗NPU 算力8 PFLOPS@FP8 后训练吞吐提升3倍 推理时延降至10毫秒 [38][39] - Atlas 860计划2027Q4发布 FP8算力翻倍至16 PFLOPS 显存容量提升至2304GB [39][40] 标卡与鲲鹏产品 - Atlas 350标卡支持850 TFLOPS@FP16算力 128GB HBM3E内存 专为高并发推理和多模态生成任务优化 [41][42] - 鲲鹏950芯片计划2026Q4发布 支持96C/192T规格 TaiShan 950 SuperPoD数据库处理能力提升2.9倍至5.4mn tpmC [44][45] 产业链与合作伙伴 - 昇腾上游产业链涵盖晶圆代工、铜连接(华丰科技)、光连接(华工科技)、电源(泰嘉股份)、PCB(深南电路等)及散热(飞荣达等)领域 [4][46] - 硬件合作伙伴包括科思科技(688788)、华大智造(688114)、广电五舟(831619)、软通动力(301236)等20余家企业 [47][49] - 大模型应用一体机合作伙伴包括蓝凌软件(834906)、恒生电子(600570)、金山办公(688111)、科大讯飞(002230)等30余家企业 [50]