高性能计算
搜索文档
英特尔晶圆代工,初露曙光
半导体行业观察· 2025-12-19 09:40
文章核心观点 - 顶级芯片设计公司(如NVIDIA、AMD、苹果、博通)正因台积电等供应商的产能限制,开始重新评估并考虑采用英特尔的前端制程(如14A节点)与后端先进封装(如EMIB)技术,这为英特尔晶圆代工业务(IFS)提供了关键的市场机遇 [1][2][4] - 英特尔的EMIB封装技术凭借其成本效益、设计灵活性以及在美国本土的产能优势,正成为台积电CoWoS技术之外的一个可行替代方案,特别是在AI和高性能计算需求激增导致先进封装供应紧张的背景下 [4][5][6] - 英特尔14A制程节点和先进封装技术获得外部客户的评估与采用,对其晶圆代工业务的成败至关重要,若能成功将巩固其市场地位,否则行业将继续依赖少数供应商 [2] 行业动态与客户评估 - NVIDIA和AMD正在评估英特尔晶圆代工的14A制程节点 [1] - 苹果和博通正在考虑采用英特尔的EMIB封装技术来开发定制服务器加速器 [1] - 苹果已在使用英特尔18A-P工艺设计套件的0.9.1版本,并等待预计2026年第一季度发布的PDK 1.0或1.1版本以进行更大规模测试 [1] - 由博通协助设计的“Baltra”服务器最初与台积电N3工艺相关,但因台积电CoWoS产能有限,苹果开始考虑英特尔的EMIB封装 [1] - 定制AI服务器部件的出货时间可能为2028年,而基于英特尔工艺的低端M系列芯片若PDK和良率达标,则有望在2027年面世 [1] - AWS和联发科等芯片设计公司据称正在选择英特尔晶圆代工作为供应商 [5] 英特尔的技术与产能优势 - 14A制程节点被定位为对外部客户极具竞争力的选择,预计在每瓦性能和芯片密度方面将有所提升,并采用EMIB和Foveros等先进封装技术 [2] - 英特尔EMIB是业界首个采用嵌入式桥接技术的2.5D互连解决方案,自2017年起已实现量产,应用于服务器、网络和高性能计算产品 [6] - 新型EMIB-M将金属-绝缘体-金属电容器直接集成到硅桥中以提升供电性能,EMIB-T则引入硅通孔技术以满足HBM的低噪声垂直供电需求 [6] - 英特尔将EMIB与Foveros结合,创建了EMIB 3.5D混合架构 [6] - 英特尔在美国本土(如新墨西哥州Fab 9和Fab 11x工厂)拥有先进的封装能力,且产能不受限制,这成为其关键战略优势 [4][5] - 报告指出,英特尔未来甚至可能采用台积电制造的芯片进行下游封装 [4] 市场竞争与替代方案 - 台积电的CoWoS封装技术因在英伟达H100/200、GB200以及AMD MI300系列产品中广泛应用,目前仍是AI GPU和HBM封装的首选 [5] - 然而,台积电的先进封装产能长期短缺,导致供应出现瓶颈,这种紧张局面正迫使主要客户寻求CoWoS之外的解决方案 [5] - 与使用硅中介层的CoWoS不同,EMIB采用局部嵌入式桥接,从而提供更高的成本效益和更大的设计灵活性,非常适合定制ASIC、芯片和AI推理处理器 [6] - 英特尔封装与测试副总裁指出,公司正在努力缓解先进封装芯片短缺的局面,并强调其优势在于不受产能限制 [5] 对英特尔晶圆代工业务的意义 - 外部客户的关注是对英特尔数十年研发投入以及在制造和先进封装领域数十亿美元投资的认可 [2] - 若能获得英伟达和AMD等公司的设计承诺,将巩固英特尔晶圆代工的地位,并为其路线图的持续投资提供依据 [2] - 如果这些合作未能实现,英特尔将面临更严峻的挑战,难以将其技术优势转化为更广泛的市场动力 [2]
这桩收购后,英伟达打造最强闭环
半导体行业观察· 2025-12-19 09:40
开源项目的商业化支持模式 - 开源项目的持续发展通常需要商业实体的支持,以提供产品整合和技术支持,因为开发者需要获得报酬 [1] - Linux内核是得到企业和机构支持的著名例子,其商业支持版本包括Red Hat Enterprise Linux、SUSE Linux、Canonical Ubuntu等 [2] - 云服务商和Nvidia等公司也会定制自己的Linux发行版以满足特定需求 [2] 英伟达在集群管理软件领域的收购与整合 - 英伟达于2022年1月收购了Bright Computing,该公司是Bright Cluster Manager的开发商,收购前共融资1650万美元,其工具在全球拥有超过700家用户 [3] - 收购后,该工具被更名为Base Command Manager,并集成到英伟达的AI Enterprise软件堆栈中,每个GPU每年的授权费用为4500美元 [3] - 英伟达为BCM提供了一个名为Mission Control的叠加层,用于自动部署其“AI工厂”,并整合了Run.ai实现的Kubernetes和Docker等技术 [6] - 2024年10月,英伟达停止单独销售Bright Cluster Manager,仅将其作为AI Enterprise Stack的一部分提供 [9] Slurm工作负载管理器的地位与英伟达的收购 - Slurm工作负载管理器在过去十年中,被约60%的Top500超级计算机所使用,代表数千台机器 [11] - Slurm项目始于2001年,由多个机构合作开发,其商业支持公司SchedMD由项目创始人在2010年创立 [10] - 英伟达已同意收购SchedMD,并表示将继续将Slurm作为开源、厂商中立的软件进行开发和分发 [11] - Slurm代码以GNU GPL v2.0许可证提供,这意味着如果英伟达试图限制它,其他人可以获取代码并进行分叉开发 [12] 英伟达的软件战略与控制意图 - 英伟达通过收购Bright Computing和SchedMD,旨在为其AI与HPC集群提供一个自上而下的集群和工作负载管理工具 [7][12] - 公司目前在全球拥有数千套BCM安装案例,并提供管理最多8个GPU节点的免费许可证,但该免费许可不提供技术支持且可能被撤销 [5][6] - 英伟达的整合面临挑战,需要将Run.ai、Slurm与Base Command Manager的功能结合,并考虑对仅使用CPU的机器及非英伟达加速器的支持 [12] - 有观点认为,英伟达作为全球重要的IT供应商,其本身也相当注重控制 [9]
雷神科技 打造全场景、有温度的电竞生活
上海证券报· 2025-12-17 02:42
公司发展历程与背景 - 公司最初是海尔集团内部孵化的第一家小微企业,现已成长为北交所“电竞装备第一股”[1] - 公司董事长路凯林于2004年入职海尔集团,在海尔电脑业务线历任产品经理、笔记本事业部营销部长、总经理等职,成为IT行业资深人士[2] - 2012年前后,海尔集团进入网络化战略阶段鼓励内部创业,路凯林团队在笔记本市场红海中发现游戏玩家需求,抓住“游戏本”概念空白进行内部创业[2] - 海尔平台为公司提供了售后、物流、供应链、资金及管理经验等资源支撑,使其得以快速抓住市场机会[2] - 公司于2022年在北京证券交易所上市,上市时北交所开市刚满一周年,其市场定位与公司发展阶段高度契合[2] 核心业务与产品策略 - 公司核心业务为高性能计算赛道,产品聚焦电竞全场景硬件装备,已形成电竞笔记本、电竞台式机、电竞显示器、外设周边四大产品系列[3] - 公司致力于实现“用户零距离”,以第一时间把握快速变化的电竞市场需求,其高管团队及大部分员工均为资深玩家,许多员工入职前即是公司粉丝[3] - 公司建立了线上线下无缝用户沟通机制,包括每年举办多场粉丝活动,以及通过论坛、QQ群、微信群等渠道保持紧密联系[3] - 通过紧密的用户调研,公司能快速响应新技术,例如在华为海思星闪技术面世后,第一时间将其应用于鼠标产品,新产品上市即售出2万件[3] 电竞生态拓展战略 - 公司在硬件产品基础上,从电竞周边和电竞生活两个方向延伸打造电竞生态,旨在为用户提供全场景、有温度的电竞生活[3] - 公司打造的新业态包括电竞房、电竞酒店、电竞台球、电竞赛事、电竞产业园等[3] - 选择生态赛道的标准直接且深入:要么能取得可观收益,要么能增强曝光量、增加用户交互[3] - 公司聚焦高校场景打造了“雷神杯ACL全国高校电竞精英赛”,截至目前赛事已覆盖130多个城市、500多所高校,累计参赛选手超20000人,累计观众人数破千万[4] - 通过打造电竞酒店,公司既为用户创造了成套体验一流电竞装备的场景,又能享受该酒店细分赛道的高增长性[4] 新增长点布局 - 公司近两年切入以AI眼镜为代表的AI硬件赛道,当前行业处于“百镜大战”的激烈竞争阶段[5] - 公司切入AI眼镜赛道的优势在于用户群体高度重合,AI眼镜和电竞设备的用户都是年轻人[5] - 对于AI眼镜这一新品类,公司路径明确:首先快速切入市场以防丧失机会;其次不断优化产品体验以做到领先;最后进行前瞻性布局,旨在推出可能部分取代手机的下一代智能眼镜[5] - 在区域业务方面,2024年公司海外业务占比已达40%,预计未来这一比例将提升至一半以上[5] - 出海业务以电竞产品为先导,目标是在高性能计算场景生态中成为领导品牌,但市场策略有差异:在北美全线主推高端电竞机型且销量已有验证;在东南亚则因当地消费能力尚未成熟,短期内不将电竞业务作为主力,而是先补充其他产品线再逐步过渡[5]
沃尔核材:拟不超15亿元扩建水口生产基地 提升生产制造与研发实力
中国证券报· 2025-12-16 22:57
项目投资概况 - 公司拟使用自筹资金不超过15亿元,在广东省惠州市惠城区水口街道投资扩建水口产业园 [2] - 项目预计建设周期为2年 [2] - 项目选址位于惠城区新民洛塘片区四个合计面积约18.53万平方米的地块,紧邻公司控股子公司惠州乐庭智联科技股份有限公司的水口基地 [2] - 该地块的国有建设用地使用权已于2025年1月通过竞拍取得,相关出让合同已签署 [2] 项目产品与产能规划 - 项目将建成以乐庭智联高速通信线、汽车智能工业线、自动化高柔性线缆、工业机器人线缆等高性能通信线缆系列产品以及高分子发泡材料系列产品为主的研发、生产与销售基地 [2] - 扩建主要为了匹配公司业务增长需求,提前进行整体产能规划与统筹,降低因产能不足带来的经营风险 [3] - 项目实施将有效提升公司的整体产能储备与交付能力,提升重点产品产能规模 [3] 项目战略与效益 - 项目选址与公司现有生产基地相邻,有利于实现人员、技术、设备、物流等多方面的协同,提升整体运营效率 [2] - 项目实施有利于公司提升整体盈利能力和市场竞争力,为公司未来持续稳定发展奠定坚实基础 [3] 行业与市场前景 - 通信线缆行业受益于全球数据中心、人工智能、高性能计算及汽车智能化等下游需求的持续增长,市场前景广阔 [2] - 高分子发泡材料因其轻量化、保温隔热、环保易回收等特性,在多个领域应用广泛,未来市场空间可观 [2]
英伟达,宣布收购
半导体行业观察· 2025-12-16 09:22
收购事件概述 - NVIDIA宣布收购开源工作负载管理系统Slurm的领先开发商SchedMD [2] - 收购旨在加强开源软件生态系统并推动面向研究人员、开发人员及企业的AI创新 [2] - 交易条款未披露,NVIDIA除官方博客外拒绝发表更多评论 [6] 收购标的:Slurm/SchedMD - Slurm是一款用于高性能计算和人工智能的开源工作负载管理与作业调度系统 [2] - Slurm最初于2002年推出,SchedMD由其主要开发者于2010年创立 [6] - Slurm被TOP500超级计算机排行榜前10名以及前100名中超过一半的系统所使用 [2] - Slurm支持最新的NVIDIA硬件,是生成式AI所需的关键基础设施,用于管理模型训练和推理 [2] - SchedMD拥有数百家客户,涵盖云服务提供商、制造商、AI公司及研究实验室,涉及自动驾驶、医疗保健、能源、金融、制造和政府等行业 [3][4] NVIDIA的承诺与计划 - NVIDIA将继续开发和分发Slurm,使其保持为开源、厂商中立的软件 [2] - 公司计划继续投资Slurm的开发,确保其保持HPC和AI领域领先开源调度器的地位 [3] - NVIDIA将加速SchedMD对新系统的访问,帮助用户优化其整个NVIDIA加速计算平台上的工作负载,并支持多样化的软硬件生态系统以运行异构集群 [3] - NVIDIA将继续为SchedMD的现有客户提供开源软件支持、培训和开发服务 [3] 战略背景与公司其他动态 - 此次收购是NVIDIA与SchedMD超过十年合作的延续 [3][6] - 收购反映了NVIDIA从收购和发布新模型两方面扩大其在开源AI领域的影响力 [6] - 在同一天,NVIDIA还发布了一系列名为Nemotron 3的新开源AI模型,声称其是构建精准AI代理最高效的开源模型系列,包括Nano、Super和Ultra三种型号 [6][7] - 近期,NVIDIA持续加强其开源和开放AI产品,例如上周发布了专注于自动驾驶研究的开放式推理视觉语言模型Alpamayo-R1,并为其Cosmos世界模型添加了更多工作流程和指南 [7] - 这些举措反映了NVIDIA对物理AI将成为其GPU下一个前沿领域的押注,旨在成为机器人或自动驾驶汽车公司在开发核心技术时的首选供应商 [7]
太初元碁乔梁:AI算法已经跑到单芯片极限|MEET2026
量子位· 2025-12-13 14:30
行业趋势与算力需求 - AI技术落地推动行业算力需求与日俱增,AI算法需要实现毫秒级精确度,带动算力需求呈指数级增长 [1][7] - 各类AI大模型、不同领域的AI Agent落地都需要大量算力支撑 [3][9] - 高性能计算将贯穿从生产制造、科学研究到AI落地的全链路,成为各类计算场景的底层支撑力量 [2][13] 超智融合与异构融合 - “超智融合发展”已成为行业共识,未来趋势是在通用计算场景下,通过硬件架构设计实现异构融合 [3][10][21] - 无论是头部企业还是知名厂商,都在不同维度上尝试将异构众核进行融合 [22] - 行业应用对算力的需求,正从传统科学计算转向以AI算法的泛化性来看待 [8][9] 技术演进与硬件瓶颈 - 单颗芯片性能已成为AI算法发展的瓶颈 [14][25] - 公司自主设计TC link,可实现128卡芯片间的高速互联(scale up),为AI算法增长提供硬件基础 [14][25] - AI算法逐渐向低精度转化,公司采用细粒度的并行优化技术,在硬件层面支持AI场景落地 [22][23] 国产算力生态与开源 - 2016年神威·太湖之光采用了纯国产自主可控的异构众核通用计算架构 [18] - 国内发展人工智能产业离不开开源生态,行业需要企业共同组建开源平台 [14][27] - 公司希望将底层硬件、软件进行开源,吸引各方共同建立AI产业生态 [27] 公司业务与实践 - 公司是一家聚焦高性能计算的国产AI芯片企业,推动HPC+AI落地 [12] - 公司优势在于算力中心建设,服务于大模型训练及大型应用场景 [26] - 公司聚焦垂直行业应用落地,例如与龙芯中科推出基于国产CPU+GPU模式的AI工作站 [27] 应用场景与案例 - 在科研领域,公司参与国内多地公共算力基础设施建设,与高校、科研机构联合攻关 [28] - 公司与百度团队合作,完成了AlphaFold3蛋白预测模型的国产平台复现 [30] - 在气候气象与能源领域,通过HPC算法分析数据,结合AI算法提升能源利用效率,支持算力基础设施发展 [33][34] - 在低空经济领域,通过HPC高精度建模分析气象数据,再导入AI模型,支撑低空领域AI Agent发展 [36]
沃尔核材:美阳投资、第一创业等多家机构于12月11日调研我司
新浪财经· 2025-12-12 12:22
公司近期经营与财务表现 - 公司2025年前三季度主营收入60.82亿元,同比上升26.17% [7][13] - 公司2025年前三季度归母净利润8.22亿元,同比上升25.45% [7][13] - 公司2025年第三季度单季度主营收入21.37亿元,同比上升23.87% [7][13] - 公司2025年第三季度单季度归母净利润2.64亿元,同比上升11.92% [7][13] - 公司2025年前三季度毛利率为32.08% [8][13] 高速通信线业务 - 受益于全球数据中心、人工智能、高性能计算等下游需求增长,公司2025年前三季度高速通信线营业收入实现快速增长 [3][9] - 公司高速通信线产品具有出色的高频性能、耐弯折、低成本、高可靠性和完善的产业链配套等优势 [3][9] - 公司控股子公司乐庭智联在通信线缆领域深耕数十年,掌握了全部重点产品的核心技术,高速通信线关键设备储备处于行业领先地位 [2][9] - 公司高速通信线的整体毛利率水平较好,盈利性较为突出 [4][10] - 公司根据市场需求动态调整排产与出货节奏,并与下游客户保持紧密沟通以匹配产能与交付 [4][10] 新能源汽车业务 - 公司新能源汽车业务相关产品近三年复合增长率在30%以上 [5][11] - 2024年度公司新能源业务直流充电枪的营业收入位居国内同行业首位 [5][11] - 公司通过核心零部件和关键材料的自主化制造、搭建全链条自制生产线、协调多基地产能及贴近客户布局,提升了产品竞争力和规模化效应 [5][11] - 公司充电枪海外销售主要通过配套桩企客户整体出口及部分主机厂客户配套出口 [5][11] - 公司正不断完善欧标、美标充电枪产品序列,并组建海外销售团队以进一步拓展国际市场 [5][11] 公司战略与未来展望 - 公司将紧跟行业技术趋势和客户需求,持续加大研发投入,聚焦产品创新与迭代 [2][9] - 公司以品质保障和高效交付筑牢客户合作粘性,持续提升品牌影响力,强化行业领先地位 [2][9] - 公司深耕新材料行业近三十年,已在技术、市场、制造、营销、品牌等方面形成全方位综合优势 [6][12] - 未来公司将通过精细化管理提升运营效率,以智能化建设赋能业务高质量发展,保持经营韧性 [6][12] 港股发行进展 - 公司已于2025年12月9日收到中国证监会出具的境外发行上市备案通知书,本次发行港股项目已获得中国证监会备案 [7][13] - 公司正积极有序推动相关发行上市工作 [7][13] 机构观点与预测 - 最近90天内共有4家机构给出评级,均为买入评级,过去90天内机构目标均价为43.21元 [8][14] - 多家机构对公司2025年至2027年的净利润进行了预测,例如华泰证券预测2025年净利润12.24亿元,2026年21.78亿元,2027年26.14亿元 [16] - 东北证券研究员的历史预测准确度为92.16%,其预测公司2025年净利润13.51亿元,2026年23.94亿元,2027年30.88亿元 [16]
光芯片,最新进展
半导体行业观察· 2025-12-12 09:12
文章核心观点 - 光计算领域正通过光子平台、存储架构和光开关等多项关键技术的最新进展而不断发展,这些进展旨在降低数据密集型系统的延迟或提高带宽,以支持未来的人工智能、高性能计算和实时决策工作负载 [2] 硅锗光子平台进展 - IHP发布了首个硅锗光子平台,其电吸收调制器的外推3 dB截止频率为140 GHz,鳍式光电二极管的外推3 dB截止频率高达200 GHz,远超当前硅光子极限 [3] - 该平台工作在C波段,采用单一工艺流程制造,是实现200Gbaud以上互连扩展的必要条件 [3] - IHP开发了一种SiGe外延方法,利用硅δ层控制吸收边,并采用紧凑型波导集成EAM结构和可调谐鳍式光电二极管设计 [3] - 该团队计划将该光子平台与其BiCMOS技术结合,以支持未来人工智能和高性能计算系统中的高性能光链路 [3] 集成光子存储器 - 威斯康星大学麦迪逊分校的研究人员开发了一种完全由商用硅光子代工厂现有组件构建的集成光子存储芯片 [4] - 该器件采用“交叉耦合差分再生光子锁存器”,模拟运行速度可达20 GHz,读取速度高达50-60 GHz [5] - 该设计完全依赖于AIM Photonics和GlobalFoundries等代工厂的标准工艺,无需新材料或新制造技术即可实现批量生产,适用于连接数据中心和高性能计算系统中处理器的大型光中介层 [5] 单光子光开关 - 普渡大学的研究人员展示了一种单光子光开关,利用雪崩倍增效应产生异常大的非线性折射率,实现了以单光子强度运行的“光子晶体管”,并有可能扩展到数百吉赫兹的时钟频率 [6] - 该器件可在室温下工作,并且兼容CMOS工艺,速度已达到吉赫兹级别,通过优化几何结构还可进一步提升 [6] - 该开关可应用于从量子信息协议到经典光子逻辑和高速光互连等多种领域,团队正在开发定制的SPAD结构,旨在进一步提高非线性 [6] 光学特征提取引擎 - 清华大学团队构建了一个12.5 GHz的光学特征提取引擎,利用集成衍射算子和片上数据准备模块实现了亚250 ps的矩阵矢量运算,解决了用于实时AI工作负载的电子处理器中的延迟瓶颈问题 [7] - 该装置在250.5 ps内完成矩阵向量乘法运算,是同类光计算中目前报道的最短延迟 [7] - 同样的硬件也应用于量化交易,其中光场效应晶体管以光子速度处理时间序列市场数据并生成买卖决策,展现出持续的盈利能力 [7] 高速电吸收调制器 - Imec在其300毫米硅光子平台上展示了GeSi电吸收调制器,带宽超过110 GHz,支持每通道400 Gb/s IM/DD传输 [8] - 该调制器面向数据中心和AI训练集群内部的短距离光链路,利用锗硅中的弗朗茨-凯尔迪什效应,实现了紧凑的几何结构、高速传输以及与晶圆级CMOS工艺的兼容性 [8] - 系统级演示采用PAM-4 IM/DD链路验证了400 Gb/s的净数据速率,测试带宽被限制在110 GHz是由于测量设备的限制,而非设备本身限制 [8][9]
2025 台积电年度观察:来自 Counterpoint 研究的 10 篇报告数据
Counterpoint Research· 2025-12-11 09:42
智能手机AP-SoC制程趋势 - 2025年,先进制程智能手机AP-SoC出货量将首次超过半数,达到51%的里程碑[4] - 台积电在先进制程智能手机SoC制造领域占据主导地位,预计2025年其出货量同比增长27%,并占据超过四分之三(>75%)的出货份额[4] - 2026年,台积电与三星将同步启动2nm节点量产,但由于三星面临良率挑战,台积电的主导地位预计将进一步巩固[4] 台积电财务与市场表现 - 2025年第三季度,台积电营收达到约331亿美元,超出此前318亿至330亿美元的指引区间,主要受3nm强劲需求及4/5nm持续高产能利用率推动[8] - 2025年第一季度,台积电在“晶圆代工2.0”市场的份额升至35%,营收同比增长超过30%[22] - 2024年第三季度,台积电在全球半导体晶圆代工市场的份额达到64%,超出预期[36] - 台积电的N3和N5等先进制程节点产能利用率持续满载,主要受强劲的AI需求和旗舰智能手机销售带动[29][36] 行业增长驱动力与前景 - 人工智能(AI)是核心驱动力,来自NVIDIA、AMD及超大规模客户对AI GPU和高性能计算(HPC)芯片的持续需求,使台积电先进节点产能利用率维持在90%以上[8][19] - 预计2025年全球纯晶圆代工营收将同比增长17%,主要受AI与高性能计算芯片驱动[15] - 台积电预计2025年与AI相关的收入将实现翻倍增长[32] - 未来五年,AI需求的复合年增长率(CAGR)预计将达到40%,将持续推动台积电的营收增长和全球产能扩张[26] 先进制程技术发展 - 台积电在2nm节点上加速布局,预计2025年下半年量产N2制程,2026年下半年量产A16制程[26] - 尽管2nm节点在2025年预计仅占总营收的1%,但到2027年,其营收贡献预计将超过10%,并有望成为未来五年内寿命最长、商业价值最大的节点之一[15] - 台积电推出COUPE 3D光学引擎,支持224 Gbps光互连,以加速光子芯片设计与量产,展示了其在硅光子等前沿技术领域的布局[11]
英伟达表示,并未放弃 64 位计算
半导体行业观察· 2025-12-11 09:23
文章核心观点 - 英伟达因其最新GPU架构(特别是Blackwell)在64位双精度浮点运算(FP64)性能上提升有限甚至倒退,而遭到高性能计算领域人士的批评[2][5] - 公司战略重心明显向低精度计算(如FP4、FP8)倾斜,以迎合人工智能(尤其是大语言模型)训练与推理的巨大市场需求[4][5] - 英伟达高管回应称公司并未放弃64位计算,并通过发布cuBLAS等软件库来模拟提升FP64性能,同时承诺未来硬件架构将提升64位核心性能[2][6][8][9] 英伟达GPU的64位性能现状与批评 - 在从Hopper架构过渡到Blackwell架构时,FP64性能未得到实质性改进,Blackwell B200的FP64性能为37 teraflops,甚至略低于H200/H100的34 teraflops[2][3][4] - 田纳西大学的Jack Dongarra在SC25大会上指出,Blackwell平台的浮点运算能力相比上一代没有提升,64位性能也未提高,是一款“带宽更高但浮点运算能力却有所下降的处理器”[2] - 对于传统高性能计算工作负载,更老款且更便宜的H100和H200在FP64性能上仍然是比Blackwell B200更优的选择[3] 英伟达GPU的性能数据对比 - **Ampere A100**: FP64性能为9.7 teraflops,FP64 Tensor Core性能为19.5 teraflops[2][4] - **Hopper H100/H200**: FP64性能为34 teraflops,FP64 Tensor Core性能为67 teraflops[2][4] - **Blackwell B100**(未发售): FP64及FP64 Tensor Core性能为30 teraflops[3][4] - **Blackwell B200**: FP64及FP64 Tensor Core性能为37 teraflops[4] - **Blackwell Ultra B300**: FP64及FP64 Tensor Core性能大幅降至1.2 teraflops,但拥有高达14 petaflops以上的低精度FP4性能[4] 战略重心转向AI与市场影响 - 英伟达GPU在低精度AI计算性能上实现飞跃,例如B200的FP4 Tensor Core性能达到18,000 teraflops,FP8 Tensor Core性能为9,000 teraflops,远超上一代Hopper产品[4] - 公司对AI市场需求做出了恰当回应,其GPU销售业绩极其强劲,并推动公司成为全球首家市值突破5万亿美元的公司[5] - 然而,这种以AI需求为导向的设计改进,导致其无法满足高性能计算领域对原始FP64运算能力的核心需求[5] 行业需求与英伟达的回应 - 高性能计算行业专家强调,FP64对科研实验室及制造业、能源、金融、医疗保健等众多行业的企业用户仍然至关重要,是“科学人工智能”的基本要求[6] - 英伟达高管承认FP64的核心地位,指出精确仿真是训练和验证AI代理的基础[6] - 公司于2024年10月发布cuBLAS库,该CUDA-X数学库可在Tensor Core上模拟双精度计算,据称能将FP64矩阵乘法的性能提升1.8倍[6] - 高管暗示公司将在未来GPU架构中提升64位计算的“核心底层性能”,但具体细节需待2026年3月的GTC大会公布[8][9] 高性能计算领域的适应与挑战 - 行业专家将当前从硬件优先的FP64向软件模拟的过渡,类比于历史上从向量处理到标量处理或从共享内存到分布式集群的转型,认为编程模型需要时间调整[8] - 在物理精度较低的环境中模拟更高精度是开发者会采用的一种技术,但专家指出“64位运算与64位向量指令并不相同”,这是一条复杂的道路[8] - 高性能计算市场希望看到FP64性能能重现从Ampere A100到Hopper H100那样的大幅提升,但目前尚不清楚英伟达是否愿意为此牺牲其AI性能[9]