Workflow
摩尔定律
icon
搜索文档
刘胜院士专访 深度解读:玻璃基板与先进封装
是说芯语· 2026-02-16 09:02
文章核心观点 - 面对AI/HPC芯片功耗达到1000W甚至1200W级别,传统外部散热已逼近物理极限,散热技术正经历从“外部辅助”向“内生重构”的范式转移 [1] - 解决“热墙”问题需要从材料、封装架构和内部结构三个维度进行颠覆性突破,这些技术将决定下一代超级算力的发展 [2][11] - 2028-2030年,半导体封装将进入“玻璃时代”,但金刚石等高性能材料将作为“性能倍增器”与其共存,形成双轨并行格局 [12][17] - 多物理场协同设计已成为指导制造端变革的核心哲学,必须贯穿于工艺、材料和装备的每一个环节,以制造出高性能、高可靠的未来芯片 [21][28] 散热技术的范式转移与颠覆性突破 - **范式转移**:散热技术正从“外部辅助”(如做大散热器、调高风扇转速)转向“内生重构”,即深入到芯片的材料基因和内部结构去解决问题 [1] - **材料层面突破(金刚石与SiC)**: - 当硅(导热率约150 W/mK)成为热阻瓶颈时,利用超高导热的金刚石(约2200 W/mK)替换传统衬底和均热板是物理学上的唯一解 [3] - **技术路径1:金刚石-SiC复合材料**:结合金刚石超高导热与SiC高机械强度,解决纯金刚石脆性和热膨胀系数不匹配问题,已实现商业化量产 [4] - **技术路径2:晶体管级金刚石生长**:在芯片晶体管极近场直接生长金刚石层,消除界面热阻,实现“自体散热”,目前处于实验室向产业转化阶段 [5][6] - **技术路径3:晶圆级异质集成**:通过表面活化键合等技术,将金刚石晶圆与硅/GaN晶圆原子层面直接结合,去除导热硅脂和焊料层,是3D堆叠芯片的终极散热形态,正从军用射频领域向顶级AI芯片下放 [7] - **封装架构博弈(SiC中介层 vs. 玻璃基板)**: - 玻璃基板互连密度高,适合连接多HBM内存,但其导热性极差,约为硅的1/150 [8] - 行业正尝试在玻璃基板中开发高密度玻璃通孔铜柱阵列,甚至在底部填充胶掺入金刚石微粉,以开辟“导热高速公路” [8] - 碳化硅中介层导热效率是玻璃的几百倍,在热流密度极高的核心区域是重要的“贵族方案” [8][9] - **结构内生化(嵌入式微流体)**: - 台积电已在CoWoS封装内部利用硅方柱蚀刻出微小流道,让冷却液直接流过发热源,实验数据显示能压制2600W功耗 [10] - 微软为自研Maia AI芯片,利用AI算法模拟树叶叶脉结构,设计出“仿生微流道”,其效率比传统直线流道提升3倍 [10] 2028-2030年封装基板材料竞争格局 - **双轨并行格局**:玻璃基板与金刚石/SiC材料并非相互取代,而是分别解决互连密度与热/功率问题,形成共存局面 [12][13] - **玻璃基板成为“量产之王”的原因**: - **技术逻辑**:随着AI芯片进入埃米级,传统有机基板因太软易翘曲已达物理极限,玻璃基板具备高平整度和可调热膨胀系数 [14][15] - **互连能力**:通过玻璃通孔技术,互连间距可做到10微米以下,使同样面积下晶体管连接数是现在的数倍 [15] - **产业信号**:英特尔大力布局,预计2026-2030年推出量产产品;韩国SKC在美国的工厂已动工 [15] - **金刚石与碳化硅的角色定位**: - 金刚石是终极热管理方案,当AI芯片功率突破1000W时,玻璃(导热率仅约1.1 W/mK)的导热能力不足 [16] - 判断“玻璃基板 + 金刚石散热层”将是顶级AI芯片的标配,金刚石将以异质集成的形式嵌入封装,负责瞬间导出热量 [16] - 行业动向佐证:英特尔代工路线图将玻璃基板列为2026年后关键技术节点;Yole Group预测玻璃基板在先进封装市场复合增长率领跑,而金刚石在热管理细分市场占据最高价值端 [17] 玻璃基板的散热解决方案 - **核心挑战**:标准玻璃热导率极低(1.1 ~ 1.4 W/(m·K)),面对AI芯片1000W+的热设计功耗时,易成为“绝热层” [18] - **Panel Level封装的三大散热思路**: - **垂直导热通道构建**:利用玻璃通孔技术,在玻璃中打出大量孔并填满铜,形成高密度铜柱阵列,这是目前最成熟直接的手段 [19] - **横向热扩散增强**:利用玻璃表面平整的优势,通过加厚金属层(厚铜再分布层与表面金属化)来增强横向散热 [20] - **异质材料集成与主动冷却**:利用玻璃的化学惰性和易蚀刻特性,直接在基板内部构建微流道冷却系统 [21] 多物理场协同设计理念与制造变革 - **核心理念转变**:多物理场协同设计不再是单纯的软件仿真步骤,而已成为指导制造端变革的核心哲学,要求基于电、热、力、磁强耦合的相互作用来定制制造 [21] - **工艺维度:以“消除界面”解决场耦合冲突**: - 混合键合是多物理场协同的完美产物,它实现了铜对铜原子级直接接触(优化电场),消除了焊料层热阻(优化热场),并利用范德华力低温键合避免了热应力(优化力场) [23][24][25][26] - 工艺开发理念转向追求“场的最优解”,例如退火工艺的温度曲线设计基于应力仿真模型倒推,以在激活杂质的同时释放残余应力 [27] - **材料维度:从“选材料”转向“算材料”**: - 需要能动态平衡各物理场的新型材料,例如底部填充胶需根据芯片热膨胀系数和弹性模量精确调配填料比例,以同时满足力学支撑、热学传导和电学绝缘的需求 [27] - 玻璃基板的引入是基于多物理场仿真发现的结果,其高刚性解决了有机基板翘曲的力学问题,低介电损耗满足了高频信号的电学需求 [27] - **装备维度:从“盲目加工”走向“闭环反馈”**: - 未来装备需具备感知物理场并实时调控的能力,例如激光辅助键合装备利用激光毫秒级局部加热,精准控制热场分布以最小化力场翘曲,保证电场连接可靠性 [28] - 需要原子级量测设备(如新型X-Ray或声学显微镜)来测量内部残余应力等“无形之力”,为制造过程装上“触觉” [28] 人形机器人对AI芯片的需求 - **“大脑”与“小脑”的精密协作**: - “大脑”负责环境感知与决策,整合触觉传感器、摄像头、激光雷达等信号,依托高算力、高带宽的AI芯片与多模态大模型 [30] - “小脑”专注于运动传感与控制动作生成,依赖力传感器与惯性传感器数据反馈 [30] - 研发AI芯片面临双重挑战:追求高AI算力的同时需保证高内存带宽;先进制程提升性能但导致功耗剧增;多内存控制器布局占用大量芯片面积 [30] - **传感技术发展趋势**: - 传感器正朝多模态融合、高集成化、低功耗、仿生智能方向演进,例如事件驱动传感、感算一体架构以实现低功耗与高能效 [31] - 灵巧手是人形机器人关键技术之一,仿生程度高,操作复杂 [31] - 实现稳定行走依赖由力传感器构成的“脚底神经”感知网络,以实时感知地面情况并实现动态平衡 [31] 半导体封装领域人才培养 - **加强交叉学科基础教育**:提倡从大一开始学习分子动力学,大二学习量子力学,以掌握多场多物理建模理论和方法 [32] - **推动产学研紧密结合**:在人才培养阶段与行业领军企业密切合作,使人才兼具产业视野和科学思考深度 [32]
英特尔,能做到吗
半导体行业观察· 2026-02-14 09:37
文章核心观点 - 美国正投入巨资建设本土先进半导体制造产能,但其技术研发仍严重依赖亚洲,存在供应链中断风险 [2] - 英特尔是美国唯一从事前沿芯片制造技术研发的公司,其技术进展(如18A、14A)对美国保持技术自主性至关重要,但公司正面临商业模式、财务和人才等多重挑战 [2][3][5] - 英特尔能否成功转型为代工厂并赢得外部大客户,是其维持先进制造研发投入、避免技术研发中断的关键,也关系到美国半导体制造业的未来 [3][5][8] 美国半导体制造业的现状与依赖 - 半导体制造商正斥资数百亿美元在亚利桑那州和德克萨斯州建设先进工厂(晶圆厂),联邦政府也投入了数十亿美元支持 [2] - 但这些新建工厂完全依赖于亚洲开发的制造技术,地缘政治或自然灾害可能导致美国工厂与亚洲技术智囊团失去联系,陷入无法研发新技术的困境 [2] - 资深行业研究员指出,如果与台湾工程师失去联系,代工厂将无法取得任何进展 [2] 英特尔的技术地位与挑战 - 英特尔位于俄勒冈州希尔斯伯勒的研究工厂拥有数千名科学家,负责研发新一代芯片制造工艺,是美国唯一从事此类前沿技术研发的公司 [2] - 英特尔开发的18A新技术在芯片架构、性能和效率方面实现重大突破,其14A是下一代生产技术 [2][3] - 但英特尔持续面临挑战:过去五年试图从台积电分羹但尚未宣布任何大型代工客户,甚至将部分尖端芯片设计外包给台积电 [3] - 公司警告,除非赢得大型外部客户,否则可能放弃14A技术研发,这将导致美国国内没有芯片制造商能自主研发先进技术 [3] 英特尔的商业模式与财务困境 - 英特尔是硕果仅存的同时设计并制造芯片的主要厂商,其整合模式曾是优势,但现在变成了沉重负担 [5] - 建造一座领先工厂需耗资100亿美元,每年还需数十亿美元跟上技术迭代,如果仅服务于自身芯片业务(市场在萎缩),则无法承担巨大支出 [5] - 为维持财务稳定,英特尔在过去18个月全球裁员3万人,其中俄勒冈州裁员6000人,当地员工数降至14年来最低点 [6] - 公司削减福利导致近8%员工自愿离职,为近二十年来最大规模,并削减了16%的研发预算,为本世纪以来最大削减幅度 [6] - 公司已搁置耗资数十亿美元的希尔斯伯勒D1X研发中心第四期工程计划 [7] 外部支持与客户获取前景 - 英特尔获得美国政府89亿美元投资,以及英伟达、软银等数十亿美元投资,这不仅是资金支持,也带来了业内影响力和潜在客户机会 [8] - 苹果、英伟达等大型科技公司不希望完全依赖台积电,可能乐于将英特尔作为第二选择,但目前尚无一家签约,表明对其交付能力缺乏信心 [8] - 华尔街给予英特尔时间,其股价过去六个月翻了一番,分析师普遍认为其即将与苹果达成协议,为部分iPad和Mac生产芯片 [12] 技术执行与人才问题 - 分析师对英特尔技术实力持怀疑态度,指出其18A芯片产能提升缓慢可能是因为缺陷率高、良率提升慢,导致成本过高且难以预测,这对14A是不祥之兆 [12] - 波特兰州立大学教授指出,英特尔对顶尖学生和研究人员吸引力下降,学生更青睐英伟达等新兴公司,同时政府的移民政策阻碍了国际人才管道 [10] - 公司内部信息传递混乱:CEO宣称将大力进军14A,但两周后CFO又称将限制对该技术的投入,直到锁定客户 [10][11] 公司的承诺与内部信心 - 英特尔高管坚称对14A项目承诺坚定不移,研发进展顺利,正在全力推进未来几代技术以重回前沿 [4][13] - 制造副总裁将研发比作烤蛋糕,表示外部客户最关心可预测的交付时间表,满足这一期望正在推动公司内部的技术复兴 [13] - 前资深工程师相信公司现在能倾听技术人员意见,并克服技术困境 [13]
一家水下AI芯片公司完成10亿元融资,瞄准大模型推理
暗涌Waves· 2026-02-13 08:57
公司近期发展与融资情况 - 算苗科技在四个月内连续完成两轮累计规模近10亿元人民币的融资 [2][3] - Pre-A轮融资由源码资本、石溪资本联合领投,联想创投等多家半导体核心产业方跟投 [3] - Pre-A1轮融资由襄禾资本领投,并获国开金融、北京顺禧等国资背景资本加持 [3] - 募集资金将用于100%国产化3D算力芯片的研发和量产 [3] 公司技术与产品核心 - 公司长期专注于3D算力芯片研发,核心产品是AI大模型推理3D定制化芯片 [4] - 公司旨在通过计算机体系结构创新和3D IC供应链解决AI大模型计算的“内存墙”制约 [4] - 现有AI芯片在推理时,高达70%的计算单元因等待数据搬运而空转,过去20年计算能力增长60000倍,内存带宽仅增长100倍 [4] - 公司研发的3D DRAM带宽可达到32 TB/s,相当于英伟达B200的4倍 [4] - 公司芯片A4的仿真数据显示,在Llama和Mixtral等主流开源大模型上,其推理吞吐量(tokens/s)能达到英伟达H200的1.26倍到2.19倍 [5] - 公司采用12nm工艺的3D架构芯片,通过将内存芯片堆叠在计算核心上并修建垂直通道,实现16-32 TB/s的带宽,以专用芯片设计换取极致推理性能 [12][13] 市场定位与战略选择 - 公司战略聚焦于AI大模型推理芯片,而非训练芯片 [15] - 从市场角度看,未来90%的AI算力需求将发生在推理侧,大模型推理算力需求将远大于训练算力 [15] - 大模型训练终将收敛,推理的成本(TCO)将成为唯一考量,这是ASIC芯片擅长的战场 [15] - 公司认为大模型推理在全球是个千亿美金的算力市场,在中国则是数千亿人民币的市场,且快速增长 [19] - 公司不做GPU,专注于3D芯片的研发、量产和全球销售,并已在该领域投资十多亿人民币 [20] - 公司相信3D芯片代表计算的未来,ASIC是解决大模型推理计算的正确路径,GPU只是过渡 [20] 创始人背景与团队构成 - 创始人汪福全曾是中科院声学所国家重点实验室博士、研究员,师从张仁和院士,后进入中科院计算所从事博士后工作,合作导师为“龙芯”首席科学家胡伟武 [5] - 公司核心科学家大多毕业于中科院计算所、声学所、自动化所以及清华等高校,团队包括半导体行业创业老兵和微软亚洲研究院的前沿AI研究员 [5] - 创始人于2009年创办中科声龙,围绕龙芯进行产业化探索,后于2018年关停相关业务,带领团队进入加密算力芯片领域 [6] - 在加密算力领域,团队选择挑战以太坊算力芯片,并于2021年第四季度推出JASMINER X4芯片,用40nm工艺实现了比英伟达7nm旗舰显卡高出20倍的加密算力功耗比,在以太坊转向POS前一年带来8亿元收入 [8] 技术发展路径与竞争优势 - 公司技术起源于攻克以太坊“抗ASIC”共识算法(ethash)带来的内存带宽瓶颈,最终在2019年底锁定3D堆叠架构 [7][8] - AI大模型计算与以太坊挖矿有相似的内存瓶颈,团队已验证3D堆叠是解决此类问题的最佳现实方案 [8] - 公司认为其生存发展的关键是“AI大模型时代,计算范式跃迁带来的新机遇” [8] - 英伟达因需维护CUDA生态和通用GPU架构的兼容性,其硬件创新受制约,而创业公司可基于第一性原理进行ASIC定制化设计,这是公司的机会 [14] - 创始人认为,在需要极致效率、具象思维的ASIC专用芯片领域,中国工程师擅长“在螺蛳壳里做道场”的精耕细作,加密算力芯片的历史已证明中国公司能称雄,AI推理战场历史会重演 [17] - 公司携手供应链伙伴,开创了中国3D堆叠芯片领域,并已在全球范围内初步形成显著优势 [20] 公司理念与行业展望 - 公司很少提“国产替代”,因其目标是成为具有国际竞争力的芯片公司,为全球AI大模型计算贡献中国优势的全新解决方案 [9] - 创始人的底气来自团队在3D IC领域多年的研发经验,以及在加密算力市场大规模商业化的成功实践 [9] - 创始人认为中国芯片产业的前途在于市场化力量,中国技术的市场化力量被严重低估 [22] - 公司在加密算力全球市场的极限生存训练,历练了团队并与国内3D IC核心供应链伙伴共同发展 [24] - AI算力在未来将像水电气一样成为新时代的基础设施,AI时代核心竞争力在于算力,算力的未来在于架构创新 [28] - 公司坚信3D堆叠架构和ASIC极致优化的设计理念,在未来5-10年内是AI大模型算力的最优解 [28]
透过ASML 2025全年财报,看增长背后的结构变化
半导体芯闻· 2026-02-11 18:59
行业趋势与周期转变 - 半导体行业正从由手机、PC等单一终端主导的传统周期,转入以“AI算力基建”为代表的多元驱动演进 [1] - 生成式AI进入应用爆发期,全球数据中心对逻辑芯片与HBM的算力需求狂热,拉动先进制程投资回暖,同时AI应用也带动对成熟制程的需求 [1] - 芯片制造设备,尤其是光刻机,是衡量本轮产业复苏质量与可持续性的关键窗口之一 [1] ASML 2025年财务与运营表现 - 2025年ASML营收、利润、在手订单全部刷新纪录:实现全年净销售额约327亿欧元,毛利率约52.8%,净利润约96亿欧元 [2][4] - 截至2025年末,ASML在手订单规模达到约388亿欧元,为2026年及之后的营收增长提供了高可见度 [4] - 公司宣布了一项高达120亿欧元的股票回购计划(执行至2028年底),显示管理层对未来现金流的信心 [19] 技术产品结构:EUV与DUV双轨驱动 - EUV(极紫外光刻)系统销售额在2025年达到116亿欧元,同比增长39% [4] - EUV在系统收入中的占比从2024年的38%上升至48%,成为公司系统收入中占比最高的单一技术类别 [4] - 截至2025年末,公司未交付的388亿欧元订单中有255亿欧元为EUV订单,并在第四季度确认了两套High-NA EUV系统收入 [4] - DUV(深紫外光刻)系统仍是半导体制造体系中不可或缺的核心设备,承担着绝大多数光刻任务 [7] - ASML的增长逻辑形成“先进制程由EUV牵引、成熟制程与先进封装由DUV支撑”的双轨结构 [8] - DUV的应用边界正从“前道晶圆制造”向“先进封装与3D集成”延伸,例如已出货面向该领域的XT:260(i-line)光刻机 [8] 中国市场表现与驱动因素 - 2025年ASML中国市场全年净系统销售额占比为33%,高于此前预期,显示出极强的韧性和需求 [9] - 成熟制程(28nm及以上)的大规模扩产是核心动力,源于汽车电子、工业自动化、物联网和家电芯片的需求,中国车企对芯片国产化的需求倒逼代工厂扩产 [10] - AI需求的“溢出效应”:AI算力中心建设产生庞大的“支持性芯片”需求(如HBM的逻辑基础层与先进封装、电源管理芯片、接口芯片),这些芯片大多由DUV完成 [11] - 端侧AI的爆发进一步推动对传感器、电源管理、模拟器件等主流芯片的需求,这些成熟制程芯片是DUV的重要需求来源 [11] - 先进封装(2.5D/3D)产线建设驱动系统级性能跃升,ASML的相关设备(如XT:260)与中国市场发展策略高度匹配 [12] - ASML预计2026年中国区收入占比将稳定在20%左右,这是全球产能配置下的“常态化回归”,公司仍在合规框架下支持中国半导体生态演进 [12] 公司战略转型:从设备商到平台公司 - ASML正在完成从“周期性设备商”向“结构性平台公司”的转变,围绕光刻环节提供全方位解决方案 [14] - “软硬一体”工程体系深化:持续强化计算光刻软件、量测与检测业务,构建围绕曝光的图形化工程平台 [15] - 2025年量测与检测系统销售额同比增长28%,达到8.25亿欧元,主要受益于YieldStar与电子束系统销量增长 [15] - 公司斥资13亿欧元战略投资Mistral AI,以利用AI强化核心竞争力 [15] - “存量复利”带来现金流重塑:2025年装机售后服务(Installed Base)营收约82亿欧元,同比增长超25%,成为继系统销售后的第二大收入来源 [15] - 收入结构从以“卖设备”为主,逐步转向“设备+全生命周期服务”更加均衡的结构 [15] 未来展望与增长指引 - ASML预计2026年净销售额将在340亿至390亿欧元区间,毛利率维持在51%–53% [18] - 2026年第一季度净销售额预计为82亿至89亿欧元,装机售后服务单季净销售额约24亿欧元 [18] - 维持长期指引:到2030年,总营收有望达到440亿至600亿欧元,毛利率提升至56%–60% [18] - AI作为最核心的需求源头,是未来增长的重要驱动力,行业对AI相关数据中心与基础设施建设的预期改善,正转化为先进制程客户对产能的实际需求,直接带动对EUV的需求增长 [18] - 量测、检测与装机售后服务业务在2026年也将持续走强 [18] - ASML正逐步向“系统级算力制造基础设施的平台公司”转型,光刻机是硬件基础,而计算光刻软件、量测与检测、装机售后服务构成放大器 [19]
AIAgent专题:Opus4.5开启AI Agent拐点,CPU需求迎高增
国信证券· 2026-02-09 19:18
行业投资评级 - 投资评级:优于大市(维持)[3] 核心观点 - 2025年11月Anthropic发布的Claude Opus 4.5模型开启了AI Agent的拐点,其强大的自主任务执行能力推动了现象级产品的出现,并直接拉动了AWS云服务收入的显著增长[4] - 2026年AI Agent的爆发将推动服务器CPU需求显著提升,CPU从辅助单元升级为调度中枢与执行载体,负载激增,促使服务器CPU与GPU的配比从传统的1:32向1:4乃至1:2演进[4] - 在后摩尔时代,CPU需求增长叠加原材料涨价和先进制程产能稀缺,CPU已开启涨价周期,截至2026年2月价格已上涨10%,预计涨价趋势可持续[4] - 全球CPU市场垄断与头部效应明显,预计2026年英特尔在服务器CPU市场份额为55%左右,AMD为40%左右。X86架构凭借生态优势占据主流,但ARM架构凭借能效和闭环生态优势正在崛起,未来市场可能向ARM+苹果生态倾斜[4] 01 Agent的现象级事件 - **AI Agent定义**:具备自主感知、规划、执行、反思、记忆的闭环智能系统,用目标驱动替代指令驱动,实现端到端任务闭环[12] - **典型产品1 - Claude Cowork**:Anthropic于2026年初推出的桌面AI协作助手,将AI代码执行能力拓展至普通办公用户,主打办公自动化,通过Computer Use API操作鼠标、键盘、浏览器、终端等,连接Gmail、Notion等应用[15] - **典型产品2 - OpenClaw**:一款开源、本地优先的AI智能体网关,定位为24/7全职数字员工,用户可通过自然语言指挥其完成本地设备上的真实操作,数据本地存储,与Telegram、WhatsApp等超过15款聊天软件集成[15] - **产品价值**:Claude Cowork提升工作流自动化水平,OpenClaw相当于用户获得可随时随地托管电脑工作的员工,两者主要替代应用之间繁琐的人工操作流,而非复杂的CRM/ERP系统[18][19] - **Agent社交网络雏形**:Moltbook作为全球首个AI专属Reddit式社交平台,AI代理可自主发帖、评论、投票,人类仅能浏览。截至2026年2月,已有超过150万AI代理和上万个社区(Submolts),显示出Agent社区生态的兴起[23][21] 02 Opus4.5模型进化开启Agentic Coding拐点 - **模型性能飞跃**:Opus 4.5在复杂任务的交付率上实现质的飞跃,在真实场景的软件工程测试SWE-Bench Verified中得分超过80%,是首个达到此水平的模型[37][35] - **编码能力**:扮演自主性极高的AI工程师角色,能进行复杂项目独立开发,包括任务分解、系统架构设计、跨文件编写和重构优化,代码一次性通过率显著优于前代模型[28][29] - **工具与生态**:Opus 4.5在工具调用、开发生态和企业平台部署上实现三位一体协同,其Computer Use(操作电脑)能力达到生产级可用,能像人一样看GUI界面并操作,打通了没有API的陈旧企业软件[32][33] - **定价策略**:引入“effort”参数实现精细化成本与性能管理,定价策略更具平衡性,输入/输出token价格降至5/25美元每百万tokens,降低了企业总体拥有成本[28][50] - **AI编程产品格局**: - **Cursor**:基于VS Code的AI增强IDE,擅长快速原型开发。截至2025年底,其年度经常性收入(ARR)已达10亿美元,估值近300亿美元,是一级市场估值最高的AI应用公司[44][45][47] - **Claude Code**:基于终端的AI编程助手,专注深度思考和系统性解决方案,与Opus 4.5深度融合,具备超大上下文(支持200K窗口)、优秀的自然语言理解和多模态基础能力[44][53] - 其他主要产品包括GitHub Copilot、Gemini CLI、CodeWhisperer等,在定位、生态和定价上各有侧重[49] 03 Agent下CPU需求爆发 - **范式转变驱动需求**:AI Agent从单次问答转向思维链循环,系统瓶颈从“算力限制”转向“逻辑运算/IO/存储限制”,CPU必须主动介入工具执行与流程编排,负载激增[56][59] - **CPU成为核心瓶颈**:CPU从辅助单元升级为调度中枢与执行载体,其负载由四大刚性开销驱动:工具执行(耗时占比最高达90.6%)、沙箱隔离、高并发与长任务、KV Cache内存溢出管理[60][61] - **算力配比演进**:AI Agent化促使服务器CPU配置从传统配比1 CPU:32 GPU(如阿里云智算集群)向1:4(如NVIDIA DGX)演进,新一代产品甚至普遍达到1:2(如NVIDIA NVL72)。预计CPU在AI服务器中的价值占比从约10%持续提升[64][65] - **CPU规格要求**:所需CPU总体呈“超多核+低功耗/高制程+大内存带宽/容量+强IO/虚拟化+更大共享缓存”特征。根据AMD CES 2026大会,2026年服务器CPU主力预计为64核,2027年两纳米商用后核数将达到128核起跳[60] - **涨价周期开启**:过去20年摩尔定律下CPU名义价格基本未涨但性能暴涨。进入后摩尔时代,需求增长叠加原材料涨价和先进制程产能稀缺,CPU开启涨价周期,截至2026年2月价格已上涨10%,预计后续仍将上涨[68][69] - **市场规模与格局**: - 预计2026年全球服务器CPU市场总出货量达3000万颗,较2025年增长超30%,市场规模有望提升至450亿美元[71][72] - 市场垄断明显,预计2026年英特尔在服务器CPU市场份额为55%左右,AMD为40%左右[4][72] - 客户端CPU出货量占比约90%,服务器CPU出货量占比约10%。服务器CPU以高核数为主(20核以上居多),桌面CPU则以4-8核为主流[71][72] - **架构竞争**: - **X86(英特尔/AMD)**:凭借稳定性和成熟的软件生态占据主流,尤其在服务器市场兼容性突出。2024年成立x86技术联盟以巩固优势[80] - **ARM(英伟达/苹果/高通)**:在能效和特定生态(如苹果闭环生态)中有优势,备受开发者青睐,预计未来市场可能逐步向ARM+苹果生态倾斜[4][80] - 国内厂商如海光(X86)、龙芯(LoongArch)、飞腾(ARM)等在国产化替代市场各有布局,但主力制程和性能与国际领先水平仍有差距[82][83]
AIAgent专题:Opus4.5开启AIAgent拐点,CPU需求迎高增
国信证券· 2026-02-09 14:48
行业投资评级 - 投资评级:优于大市(维持) [3] 核心观点 - 2025年11月Anthropic发布的Claude Opus 4.5模型开启了AI Agent的拐点,其强大的“代理式编码”能力使AI从“超级实习生”升级为“资深架构师”,推动AI应用场景全面迈向“任务执行与结果交付” [4] - 2026年以来,基于Opus 4.5等底层模型的技术进化,AI Agent现象级产品不断涌现,例如Claude Cowork、OpenClaw和Moltbook,标志着Agent的爆发 [4] - AI Agent的爆发将显著提升CPU需求,CPU角色从辅助单元升级为调度中枢与执行载体,服务器中CPU与GPU的配比将从传统的1:32向1:4乃至1:2演进,驱动CPU向超多核、低功耗、大内存带宽等特征发展 [4] - 在后摩尔时代,受AI需求增长、贵金属原材料涨价及先进制程产能稀缺等因素推动,CPU已开启涨价周期,2026年2月价格已上涨10%,预计涨价趋势可持续 [4] - 全球CPU市场呈现垄断格局,预计2026年英特尔在服务器CPU市场份额为55%,AMD为40% [4]。X86架构凭借稳定性和成熟生态占据主流,但ARM架构凭借能效和闭环生态优势正在崛起,未来市场可能向ARM+苹果生态倾斜 [4] 01 Agent的现象级事件 - **AI Agent定义**:AI Agent是具备自主感知、规划、执行、反思、记忆闭环的智能系统,能用目标驱动替代指令驱动,实现端到端任务闭环,架构范式从“静态模型”转向“闭环智能体”,从“被动工具”转向“自主数字员工” [12] - **典型产品1:Claude Cowork**:由Anthropic于2026年初推出,是一款桌面AI协作助手,主打办公自动化,通过Computer Use API操作鼠标、键盘、浏览器、终端,能对本地文件进行操作并连接Gmail、Notion、Asana等企业应用,将AI代码执行能力从开发者拓展至普通办公用户 [15] - **典型产品2:OpenClaw**:一款开源、本地优先、可执行任务的AI智能体网关,定位为24/7全职数字员工,用户可通过自然语言指挥其在自有设备(Mac/Windows/Linux/云服务器)上执行真实操作,所有数据本地存储,并与Telegram、WhatsApp等超过15款聊天软件集成 [15] - **产品价值**:Claude Cowork主要提升文件处理、浏览器自动化、表格/文档制作等工作流的自动化水平;OpenClaw则相当于让用户获得一个可随时随地托管电脑桌面工作的员工 [19]。综合来看,Agent不会立即替代复杂的CRM/ERP系统,但会替代应用之间繁琐的人工操作流 [18] - **典型产品3:Moltbook**:全球首个AI专属的Reddit式社交平台,于2026年初创建,规则是AI代理(Moltys)可发帖、评论、投票、创建社区,而人类只能浏览无法参与任何互动 [23]。截至2026年2月,该平台已有超过150万AI代理和上万个社区(Submolts) [23] - **社区影响**:以OpenClaw(曾用名Clawdbot)为例,其在GitHub上获得了超过60k的Stars,这被视作一场类似早期互联网的黑客运动,正在加速AI技能的进化 [21] 02 Opus4.5模型进化开启Agentic Coding拐点 - **模型能力飞跃**:Opus 4.5在复杂任务的交付率上实现质的飞跃,其编码优势体现为一种从高效执行到全流程自主软件工程的能力,能够进行复杂项目独立开发、代理式智能协作和专业级成果输出 [27][28] - **性能测评领先**:在真实场景的软件工程测试SWE-Bench Verified(n=500)中,Opus 4.5的准确率达到80.9%,是首个在该测试中获得80%以上分数的模型,显著优于其他竞品模型(Sonnet 4.5为77.2%,Opus 4.1为74.5%,Gemini 3 Pro为76.2%,GPT-5.1为76.3%) [34][35][36] - **定价与成本控制**:Opus 4.5的定价策略实现了性能与成本的平衡,以显著降低的价格提供顶级智能体验,并引入了“effort”参数作为资源调控器,可根据任务重要性与复杂性在高、中、低模式间灵活切换,实现精细化成本与性能管理,大幅提升计算资源投入效率 [28][29] - **工具与生态成熟**:Opus 4.5在工具与生态上实现三位一体协同设计,对内模型能力、对外开发生态、对下部署平台均得到增强 [32]。其Computer Use(操作电脑)能力达到生产级可用,能够像人一样直接看GUI图形界面并操作,打通了所有没有API的老旧企业软件,相当于一个不知疲倦的RPA机器人 [33] - **AI编程产品格局**:报告将AI编程能力分为L1到L5等级,Opus 4.5与Claude Code的协同使AI编程进入L4(人工智能软件工程师)乃至L5(多AI协作)阶段 [39]。市场主要产品呈现差异化竞争:Claude Code在“项目级闭环+MCP企业工具生态+安全治理”上更像“工程代理”;GitHub Copilot深度集成IDE;Cursor则主打架构/跨文件/全流程Agent与多模型路由 [48][49] - **Cursor市场表现**:Cursor作为AI编程龙头,其年度经常性收入(ARR)在2025年底已达到10亿美元,最新估值达293亿美元,是目前一级市场中估值最高的AI应用公司 [45][47]。其网站访问量在2025年呈现显著增长趋势 [46] 03 Agent下CPU需求爆发 - **范式转变驱动需求**:AI从问答/Chat到行动/Agent的范式转变,带动CPU负载激增。系统瓶颈从“算力限制”转向“逻辑运算/IO/存储限制”,CPU必须主动介入工具执行与流程编排,而不仅仅是等待GPU [56][57][59] - **CPU成为核心瓶颈**:在Agent完成感知-规划-工具调用-再推理的闭环中,CPU从辅助单元升级为调度中枢与执行载体,其负载由四大刚性开销驱动:工具执行、编排调度、沙箱隔离、高并发与长任务,成为影响Agent系统延迟、吞吐与能耗的核心瓶颈 [60] - **工具执行**:耗时占比最高达90.6%,动态能耗占比可达44% [61] - **沙箱隔离**:每个Agent任务需独立的微VM环境以保证安全,创建与销毁开销巨大,资源占用随并发线性增长 [61] - **高并发**:多智能体协作带来爆发式请求,预计2030年活跃Agent数将达22亿 [61] - **KV Cache溢出**:长上下文导致KV Cache急剧膨胀,需将数据卸载(Offload)至CPU内存,带来极高的内存带宽压力 [61] - **算力配比演进**:AI Agent化促使服务器CPU配置从传统的1:32(如阿里云智算集群、AWS Trainium集群)向1:4(如NVIDIA DGX、阿里云ECS实例)演进,新一代产品甚至普遍达到1:2(如NVIDIA NVL72) [4][64][65]。例如,英伟达在2026年CES展出的Rubin架构采用了1个CPU对应2张显卡的设计 [65] - **CPU技术发展路线**:为满足Agent需求,CPU正沿着“通过先进制程实现在更高核心密度下的功耗可控”这一主线发展,所需CPU总体呈“超多核+低功耗/高制程+大内存带宽/容量+强IO/虚拟化+更大共享缓存”特征 [4][60]。根据AMD CES 2026大会信息,2026年服务器CPU主力为64核,2027年两纳米商用后核数将达到128核起跳 [60] - **CPU涨价周期开启**:过去20年在摩尔定律下,CPU名义价格基本未涨但性能暴涨。目前进入后摩尔时代,受CPU需求增长、贵金属原材料涨价、先进制程产能稀缺影响,CPU已开启涨价周期,截至2026年2月价格已上涨10%,预计涨价趋势可持续,2026年上半年还计划涨价10%-15% [4][68][69] - **市场规模与格局**:2026年全球服务器CPU市场总出货量预计达3000万颗,较2025年的2300万颗增长超30%,市场规模有望提升至450亿美元 [71][72]。其中,通用CPU市场客户端CPU出货量占比约90%,服务器出货量占比10% [71]。预计2026年英特尔在服务器CPU市场份额为55%左右,AMD为40%,两家共同占据超九成市场份额 [4][72] - **架构竞争态势**:X86架构(英特尔/AMD)凭借稳定性和成熟的软件生态占据主流,尤其在服务器市场兼容性突出 [4][80]。ARM架构(英伟达、苹果、高通阵营)在能效和特定生态(如苹果闭环生态)中有优势,备受开发者青睐 [4][80]。预计未来市场可能逐步向ARM+苹果生态倾斜 [4] - **主要厂商技术路径**: - **ARM路线**:以英伟达为代表,注重与GPU深度协同及能效优势 [83] - **AMD路线**:聚焦多核与先进制程,计划推出2纳米工艺的“Venice”服务器CPU,通过双I/O die封装实现多达256核 [83] - **英特尔路线**:坚持X86架构主导,通过与AMD成立技术联盟巩固生态,产品迭代以制程升级为核心 [83]
当硅逼近极限,这家初创企业抢滩原子级芯片新赛道
36氪· 2026-02-09 10:24
行业背景:摩尔定律的挑战与二维半导体的兴起 - 传统硅基芯片遵循的“摩尔定律”(晶体管数量每18-24个月翻倍)在3纳米及以下节点正面临物理极限的根本性挑战,性能提升空间日益有限 [2] - 全球半导体产业正并行推进“延续摩尔”(在硅体系内结构创新)和“超越摩尔”(寻找下一代技术)两条路径,二维半导体是“超越摩尔”路径中最具潜力的方向之一 [3] - 二维半导体是指沟道厚度仅为一个或几个原子层的新型材料,其原子级厚度能带来更强的栅控能力、更低的漏电流和更优的功耗性能,有望在不依赖极端复杂结构的前提下继续推动器件性能演进 [3] 技术突破:从实验室验证到工程化探索 - 复旦大学团队于2025年4月成功研制出全球首款基于二维半导体材料的32位RISC-V架构微处理器“无极(WUJI)”,首次实现了基于二维半导体材料5900个晶体管的集成度,突破了二维半导体电子工程化瓶颈 [4] - “无极”芯片目前集成的5900多个晶体管,沟道尺寸仍是微米级,且仅为NMOS逻辑电路,并非完整的CMOS芯片,其整体性能参数相当于上个世纪的英特尔8080处理器水平,主要价值在于证明了二维半导体能做系统级逻辑 [11] - 团队下一步的核心目标是实现从NMOS转向CMOS,并将晶体管尺寸缩小到百纳米甚至更小,最终在集成度、性能、良率和可靠性方面达到产业可接受的阈值 [11] 产业化进程:工程化示范线的建设与意义 - 原集微科技(上海)有限公司在2025年6月启动国内首条二维半导体工程化验证示范工艺线建设,并于同年12月获得近亿元天使轮融资,目前该示范线已在上海浦东新区川沙新镇正式点亮 [6] - 这条示范产线对应的硅基制程节点大约在180纳米(相当于2000年前后的水平),对初创企业而言是投入和风险相对可控的选择 [12] - 该产线的目标是先在180纳米节点上,把二维半导体CMOS工艺完整跑通,实现从几千个晶体管到百万门级的集成规模,做出单片机或兆级别的存储单元,若能实现稳定流片并达到一定良率,将是一个足以引起工业界高度关注的突破 [12] 竞争格局与机会窗口 - 全球半导体巨头如台积电、三星、英特尔等均已将二维半导体列为1纳米节点后最有可能代替硅的晶体沟道材料,并展示了各自研发的原型器件 [8] - 在二维半导体这一全新赛道,全球目前可以说是站在同一起跑线上,但国际巨头的核心精力仍集中在硅基技术上,未来几年是关键的窗口期,若国内不抓紧推进产业化和工程平台建设,积累的科研优势可能被迅速抹平,差距会被巨头的工程化资源优势迅速拉开 [8][13] - 国内在二维半导体的材料、物理、化学性质等科研层面起步早、基础不薄弱,甚至领先,真正的挑战在于将新型材料做成可量产集成电路的工程化环节 [13] 技术优势与产业化逻辑 - 延续摩尔定律的路径(如使用EUV光刻机、发展GAA及CFET三维结构)性价比正在迅速下降,晶体管结构和工艺越来越复杂,但性能提升有限且良率难以控制,投入与产出的边际效益趋近于零 [9] - 二维半导体的核心优势在于其本身是原子级厚度沟道材料,可实现栅电极对电子的精准调控,为电子流动提供低阻力的二维“高速公路”,这使得微缩晶体管尺寸更为简单,可显著简化工艺流程,从而降低成本、提升良率 [9] - 从“第一性原理”看,晶体管的“终极形态”本就应该是原子级厚度的沟道材料,这样才能实现速度和功耗的最佳状态 [10] 公司战略与发展规划 - 公司研发过程中引入AI驱动的一体化工艺优化,以应对芯片制造流程超过2000个工艺步骤、未来可能达3000步以上的复杂性,AI可以大幅加速工艺优化进程,弥补初创公司无法用几十年、数万亿美元去重复硅基工艺优化过程的短板 [14] - 公司将重点推进二维材料表征和量测层面的工艺规范和标准建设,计划与高校及科研团队共同参与制定相关标准,以协同上游材料厂商、设备厂商及下游封装和设计企业,构建不完整的产业生态 [15] - 公司本轮融资的核心用途是扩充人才团队、洁净间建设、工艺设备采购以及工艺研发,旨在使二维定制工艺与产业主流设备更高效地协同适配,加速集成工艺迭代,提升良率与制造效率,实现从“实验线”到“生产线”的跨越 [16]
涨涨涨,60 系显卡又跳票,2026 只有涨价没有升级
36氪· 2026-02-09 09:52
英伟达产品战略重大调整 - 英伟达决定将2026年的重心全面转向AI产品,导致原被广泛期待的RTX 60系列游戏显卡发布时间大幅推迟至2027年末 [1] - 为应对硬件更新空白期,公司推出DLSS 4和4.5软件更新,其中DLSS 4.5破天荒地支持全系列RTX显卡,旨在为旧型号如20系、30系显卡“延寿” [4] - 结合RTX 3060将重新投产的消息,软件更新被视为硬件发展停滞背景下维持市场的一种策略 [8] 内存市场长期涨价与AI影响 - 英特尔CEO陈立武预测,当前一轮内存涨价周期至少将持续到2028年,且目前无任何缓解迹象 [10] - AI发展是核心驱动因素,规模化AI芯片对高带宽内存需求“变态”,吸干所有存储资源 [12] - 内存大厂将绝大部分研发和生产资源投入高利润的HBM内存,导致民用DDR4/5和LPDDR系列产能被挤占,推高手机和电脑厂商的基础零件采购成本 [14] 芯片制程进步放缓与成本压力 - 台积电初代2nm工艺相比成熟的3nm性能与能耗进步不明显,而进阶的N2P工艺需以近20%的成本提升换取仅5%的性能提升 [17] - 由于2nm芯片叠加昂贵内存将使终端产品价格难以承受,厂商被迫选择保守路线,在2026年于3nm工艺上反复“打磨”产品 [17] - 摩尔定律的时间预测失效,主因是资源被AI吞噬,厂商为保基础利润选择“原地踏步” [19] 消费电子行业面临“滞胀”局面 - 2026年,从手机、平板、笔记本到PC,行业将普遍采用“打磨”战术,新品可能“名字升级、规格降级” [19][21] - 消费者面临两难选择:产品要么是小改良、小涨价,要么是大升级、大涨价 [21] - 行业进入技术“长假”,新品不再代表性能进步,而是周边溢价,组装电脑可能面临价格更贵、内存更少而体验无质变的局面 [23] 行业资源分配与消费者影响 - 为支持大厂在AI领域圈地,普通消费者的基础体验成为被牺牲的部分 [26] - 由SoC直接带来的硬件红利消失,增强了数码产品的金融属性 [26] - 2026年消费电子市场在售价上涨、性能停滞、成本飙升三重夹击下,每一笔消费都需更加慎重 [28]
苹果承认:芯片麻烦了
新浪财经· 2026-02-04 18:31
苹果公司业绩指引与供应链瓶颈 - 苹果公司预计其2026财年第二季度业绩将受到台积电尖端制程处理器供应限制 这是该公司多年来首次发布此类声明[1] - 供应瓶颈在于先进制程节点的产能 由于第一季度业绩增长23%导致产能提升空间缩小 无法大幅提高产能[1] - 公司对下一季度的业绩指引基于对供应受限的最佳估计 情况瞬息万变[1] 台积电先进制程产能竞争加剧 - 台积电2纳米(N2)工艺产能被芯片制造商大规模采用 NVIDIA、AMD和ASIC设计商等都在争夺产能[2] - 苹果和高通等移动客户将推动2nm工艺初期应用 随后焦点将转向人工智能巨头[2] - AMD计划在下半年发布的Instinct MI400系列显卡上采用2nm工艺 NVIDIA的下一次重大升级将采用Feynman工艺搭载A16(1.6nm)芯片[2] - 亚马逊和谷歌等ASIC厂商也将占据台积电N2工艺产能的相当大一部分[2] - 台积电在晶圆代工领域处于领先地位 所有累积需求涌向该公司 晶圆代工领域选择寥寥无几[3] - 英伟达CEO表示台积电需要提升产能以跟上人工智能热潮 甚至表示将在十年内将产能翻一番[3] 存储器市场动态与价格飙升 - DRAM合约价格正以前所未有的速度上涨 季度报价几乎翻了一番[4] - 美光率先提议合约价格较2025年第四季度大幅上涨115%至125%[4] - 本季度签署的大部分长期协议集中在服务器DRAM上 大部分内存需求已转向人工智能行业[4] - 目前内存市场完全是卖方市场 买家在批量采购方面几乎没有议价能力[4] - TrendForce预计本季度DRAM价格将上涨90%至95%[4] - DRAM价格上涨将影响消费产品 尤其是在搭载新平台的新款笔记本电脑陆续上市之际 消费级GPU的GDDR内存条价格走势很可能类似[4][5] - 美光晶圆厂建设计划要到2028年才会产生实质性影响 供应商对大幅提高DRAM产量持怀疑态度 短缺状况预计将持续几个季度[5]
苹果承认:芯片麻烦了
半导体行业观察· 2026-02-03 09:35
苹果公司业绩预警 - 苹果公司预计其2026财年第二季度业绩将受到台积电先进制程处理器供应限制,这是该公司多年来首次发布此类声明[2] - 公司首席执行官指出,瓶颈在于先进制程节点的产能,由于第一季度业绩增长23%,导致产能提升空间缩小,无法大幅提高产能[2] - 公司首席财务官强调,下一季度的业绩指引是基于对供应受限情况的最佳估计,表明情况可能随时变化[2] 台积电先进制程产能紧张 - 台积电的2纳米工艺正被英伟达、AMD和ASIC设计商等芯片制造商大规模采用并争抢产能[2] - 高性能计算客户在台积电总收入中占据相当大份额,随着N2级制程出现,芯片制造商影响力预计将进一步增强[3] - 2纳米制程的客户产能达到历史最高水平,初期由苹果和高通等移动客户推动,随后焦点将转向人工智能巨头[3] - 台积电在每次制程升级(如从5纳米到4纳米再到3纳米)时,客户采用率都屡创新高,所有累积需求涌向这家行业领导者[4] - AMD计划在其将于下半年发布的Instinct MI400系列显卡上采用2纳米工艺,而英伟达的下一次重大升级将采用Feynman工艺,搭载A16芯片[3] - 亚马逊和谷歌等ASIC厂商也将占据台积电N2工艺产能的相当大一部分,表明高端工艺竞争已显著加剧[3] 存储器市场动态 - DRAM合约价格正以前所未有的速度上涨,季度报价几乎翻了一番[6] - 美光率先提交方案,提议合约价格较2025年第四季度大幅上涨115%至125%[6] - 本季度签署的大部分长期协议集中在服务器DRAM上,大部分内存需求已转向涉及超大规模数据中心、芯片制造商和服务器ODM厂商的人工智能行业[6] - 目前内存市场完全是“卖方市场”,买家在批量采购方面几乎没有议价能力[6] - TrendForce预计本季度DRAM价格将上涨90%至95%[6] - 美光的晶圆厂建设计划要到2028年才会产生实质性影响,供应商对大幅提高DRAM产量持怀疑态度,短缺状况预计将持续几个季度[7]