Workflow
人工智能推理
icon
搜索文档
这项技术,颠覆芯片堆叠
半导体行业观察· 2026-01-09 09:53
文章核心观点 麻省理工学院的研究团队提出并演示了一种创新的芯片制造方法,通过在传统CMOS芯片的后端工艺(BEOL)区域低温堆叠有源器件层,将逻辑晶体管和存储器晶体管垂直集成,从而显著减少数据在逻辑与内存之间传输的能耗和时间,为人工智能推理、深度学习等以数据为中心的计算工作负载提供高能效解决方案 [1][6][8] 技术原理与架构创新 - 研究团队颠覆传统制造顺序,在芯片后端工艺(BEOL,传统上用于布线的区域)添加有源晶体管层和存储元件,避免了高温前端工艺对底层已完成电路的损坏 [1][2][10] - 该技术创造了一个垂直集成的器件堆叠结构,缩短了计算、嵌入式存储器和互连之间的物理路径,从而减少了传统布局中因数据移动造成的能量浪费 [2][6] - 该方法并非取代先进节点的硅器件,而是在现有芯片主要用于布线的区域添加新的功能层,以提高集成密度和能效 [6][10] 关键材料与工艺突破 - 使用非晶氧化铟作为BEOL晶体管的有源沟道层,因其独特性质,可在约150°C的低温下生长极薄的氧化铟层,不会损坏下方电路 [2][10] - 氧化铟薄膜厚度仅约2纳米,团队通过优化制造工艺,最大限度地减少了材料缺陷(氧空位),使晶体管能够快速且干净地切换,降低了开关所需的额外能量 [4][11] - 集成铁电铪锆氧化物(HZO)层以实现存储器功能,这是一种CMOS兼容的实用材料选择 [4][7] 器件性能与成果 - 制造的BEOL逻辑晶体管开关迅速且缺陷少,降低了开关能耗 [4][11] - 集成的存储器BEOL晶体管尺寸约为20纳米,开关速度达到10纳秒(达到测量极限),且工作电压低于同类器件,功耗更低 [4][11] - 该研究提供了一个可堆叠平台,并完成了从独立器件到电路级集成所需的性能建模(与滑铁卢大学合作) [6][12] 应用前景与影响 - 该技术最直接的受益者是内存流量占主导地位的工作负载,包括人工智能推理、深度学习以及需要反复传输激活值和权重的计算机视觉任务 [6][9] - BEOL中的存储晶体管能够实现存储和计算之间更紧密的耦合,支持内存内和近内存计算方案 [7] - 铁电器件缩小到纳米级为研究单个铁电单元的物理特性提供了平台,可能影响未来存储和计算单元的设计 [7][11] - 该技术有望帮助减少生成式人工智能、深度学习等高要求应用日益增长的计算电力消耗 [9] 后续计划 - 短期计划是将后端存储晶体管集成到单个电路中 [7][12] - 未来将致力于提高晶体管性能,并进一步优化对铁电层特性的控制 [7][12]
大佬就是大佬!黄仁勋一句话引爆市场,牛股飙涨1080%,这类股集体闪崩
新浪财经· 2026-01-07 13:37
文章核心观点 - 英伟达首席执行官黄仁勋在CES 2026的演讲对美股市场产生显著影响 其关于人工智能存储需求的言论推动存储类股票集体大涨 而其关于下一代芯片冷却技术的言论则引发数据中心冷却类股票下跌 [1][4][14] 存储类股票市场反应 - 闪迪股价在周二飙升近28% 报349.63美元/股 创历史新高 自去年2月以来已暴涨10倍 总市值达512.4亿美元 [2] - 闪迪在2026年前三个交易日涨幅超过47% 自去年4月22日触底以来累计飙升1080% [4] - 西部数据股价上涨16.77% 报219.38美元/股 总市值750.1亿美元 自去年4月以来涨幅近700% [7] - 希捷科技股价上涨14% 报330.42美元/股 总市值705.6亿美元 自去年4月以来涨幅超过400% [7] - 美光科技股价上涨10% 报343.43美元/股 总市值3865亿美元 自去年4月以来涨幅超过400% [7] - 闪迪、西部数据、希捷科技和美光科技在周二均创下历史新高 其中闪迪是标普500指数中表现最佳的股票 [6] 存储需求增长驱动因素 - 黄仁勋强调人工智能相关的存储需求已超过现有基础设施能力 待处理数据量“现在实在是太大了” [4] - 黄仁勋称人工智能存储是一个“完全未被开发的市场” 很可能成为全球最大的存储市场 将承载全球人工智能的工作记忆 [4] - 彭博行业研究指出 人工智能训练和推理需求增长导致内存供应紧张和价格飙升 从而推高数字存储股票 [12] - 三星电子和SK海力士计划在2026年第一季度将服务器DRAM价格较去年第四季度上涨60%至70% [12] - 美国银行分析师认为 闪迪等存储设备公司是2026年“人工智能推理和边缘人工智能”发展趋势的“主要受益者” [14] - 企业将因训练、分析和合规等目的保留更多数据 存储需求将“同步飙升” 无人机、监控、车辆和体育科技等领域需求不断增长 [14] - 人工智能投资主题正从模型训练引发的资本支出 转向以人工智能推理为主导的下一波硬件支出浪潮 [14] 数据中心冷却类股票市场反应 - 黄仁勋的演讲引发对数据中心冷却产品需求的担忧 导致相关股票下跌 [14] - 江森自控国际公司股价下跌6.24% 盘中最高跌超10% 创下7月以来最大单日跌幅 总市值696.4亿美元 [15] - 摩丁制造公司股价收跌7.46% 盘中最高跌超20% 总市值68.43亿美元 [15] - 特灵科技公司股价下跌2.52% 盘中最高跌超10% 总市值845亿美元 [15] - Vertiv Holdings Co 股价周二盘中跌超6% 但收盘上涨0.57% 总市值668.9亿美元 [21] 冷却技术变革与行业观点 - 黄仁勋表示 使用特殊技术可为搭载英伟达下一代Rubin芯片的机架降温 而无需使用水冷机组 [18] - 彭博行业研究指出 水冷机组是江森自控和特灵等公司为数据中心提供的“主要”设备 [18] - 贝尔德分析师认为 该言论引发了对冷水机组在数据中心长期定位的疑问 尤其是在液冷技术日益普及的背景下 [19] - 花旗分析师认为投资者“过度”抛售了冷却系统相关股票 冷却系统制造商与芯片商及数据中心运营商联系密切 其风险可控 [21] - 巴克莱银行分析师指出 Vertiv在液冷领域拥有“强大地位” 可能受益于该技术发展 但其冷水机业务可能受影响 [21] - 尽管英伟达言论影响重大 但花旗分析师认为冷却技术的快速发展并未让相关公司感到意外 [21]
谷歌AI论文趋势:推理为王
华福证券· 2025-12-31 10:43
行业投资评级 - 传媒行业评级为“强于大市”(维持)[7] 报告核心观点 - 报告核心观点是看好AI推理端算力的爆发,认为通过专注AI推理过程的算法优化并给予大模型充足的推理算力,能使模型表现变得更快、更好、更有效[6] - 报告认为谷歌的动向揭示了行业新趋势:从训练推理模型转向关注推理过程本身,推理过程正成为获取智能、处理复杂信息的关键环节,算力价值从后台训练转移到了前台实时推理[5] 行业动态跟踪:谷歌前沿产品进展 - 2025年12月4日,谷歌向Google AI Ultra订阅用户推送Gemini 3 Deep Think模式,运用并行思维技术推动思维能力前沿[3] - 其上一代模型Gemini2.5 Deep Think鼓励模型利用扩展推理路径,使深度思维随时间推移成为更优秀、更直观的问题解决者[3] - 通过延长推理或思考时间,让AI有更多时间去探索不同假设,并对复杂问题提出创造性解决方案[3] 行业技术趋势:推理算法进步 - 谷歌论文《Titans: Learning to Memorize at Test Time》提出新的神经长时记忆模块,能学习记忆历史上下文,并运用遥远历史信息协助注意力机制聚焦当前上下文[4] - 该神经记忆模块兼具快速并行化训练与高效推理优势,注意力机制被视为短期记忆,而神经记忆则发挥长期、更持久记忆的作用[4] - 论文提出同时具备注意力机制和元上下文记忆的结构“Titans”,能在测试时学习记忆[4] - 谷歌论文《Nested Learning: The Illusion of Deep Learning Architecture》提出全新机器学习范式“嵌套学习NL”,模仿人脑认知机制路径[5] - “嵌套学习”将短期内记忆快速更新、长期记忆缓慢沉淀的过程逻辑数字化,每个层级拥有独立上下文流和更新频率[5] - 从嵌套学习视角提出连续记忆系统CMS,每次更新仅包含少量参数,减少算力需求,使大语言模型能在不断学习新技能的同时不遗忘旧技能,计算效率将大幅提升[5] - 谷歌团队试图打破现有大模型训练即固化的静态模式,让学习不再仅限于训练过程,而是发生在推理现场[5] - 现有Transformer模型通过Attention机制处理长文本计算成本高,且本质上是短期记忆,一旦超出上下文窗口信息就被丢弃[5]
伯恩斯坦:英伟达与Groq交易具有战略意义
新浪财经· 2025-12-29 20:39
分析师评级与目标价 - 伯恩斯坦分析师Stacy A Rasgon重申对英伟达的跑赢大盘评级,并维持275美元的目标股价 [1] 公司与Groq的合作协议 - 英伟达与人工智能芯片初创企业Groq达成一项价值200亿美元的合作协议,后被证实为Groq推理技术的非独家授权协议 [1] - Groq核心管理团队将加盟英伟达,而Groq本身将在新任首席执行官西蒙・爱德华兹的领导下保持独立运营,同时继续开展其云端业务 [1] 合作战略意义与市场影响 - 此项合作具有战略意义,能够巩固英伟达在人工智能推理领域的市场地位 [1] - 相较于模型训练领域,人工智能推理市场的竞争更为激烈 [1] - 随着推理需求的持续增长,此举将进一步强化英伟达的行业龙头地位 [1]
国产GPU第二股沐曦股份大涨近560% 单签盈利近30万元
新华财经· 2025-12-17 09:54
公司上市与市场表现 - 沐曦股份于12月17日正式在上海证券交易所科创板上市,股票代码为688802 [1] - 上市首日竞价高开568%,截至发稿时涨幅为559%,报690元/股 [1] - 公司总市值接近2800亿元,投资者单签盈利近30万元 [1] 发行与募集资金 - 本次发行价格为104.66元/股,是年内科创板新股中第二高的发行价,仅次于摩尔线程的114.28元/股 [2] - IPO募集资金将用于新型高性能通用GPU研发及产业化项目、新一代人工智能推理GPU研发及产业化项目以及面向前沿领域及新兴应用场景的高性能GPU技术研发项目 [2] - 网上发行申购投资者户数达517.52万户,超过摩尔线程的482.66万户 [2] - 回拨机制启动后,网上发行最终中签率约为万分之三点三 [2] 公司业务与产品 - 公司是国内高性能通用GPU领域的领军企业之一 [2] - 致力于自主研发全栈高性能GPU芯片及计算平台 [2] - 主要产品线包括用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU,以及正在研发用于图形渲染的曦彩G系列GPU [2] - 最新一代产品曦云C600系列性能介于英伟达A100和H100之间 [2] - 曦云C600系列实现了从芯片设计到封装测试的全流程国产供应链闭环,预计2024年底进入风险量产阶段,2025年上半年正式量产 [2] 行业背景 - 2023年内A股半导体行业共有7只新股上市,包括昂瑞微、摩尔线程、恒坤新材、西安奕材、屹唐股份、新恒汇和矽电股份 [3] - 上述7只半导体行业新股上市首日的平均涨幅约为242.94% [3]
苹果首款服务器芯片,更多细节曝光
半导体行业观察· 2025-12-16 09:22
苹果定制AI服务器芯片“Baltra” - 苹果公司为其定制AI服务器芯片设定的内部代号为“Baltra”,预计将于2027年首次亮相[2] - 早在2024年春季,就有报道称苹果正与博通合作开发其首款AI服务器芯片,设计过程预计在未来12个月内完成[2] - 该芯片预计将采用台积电的3nm“N3E”工艺制造[2] 芯片的预期用途与设计 - 苹果预计不会用于训练大型AI模型,尤其是在已与谷歌达成协议,部署定制的3万亿参数Gemini模型为云端Apple Intelligence提供支持之后[2] - 公司每年将向谷歌支付10亿美元以获得使用该模型的权利[2] - 可以合理推断,苹果将主要使用“Baltra”芯片来满足其庞大的人工智能推理需求[3] - 推理芯片的架构与训练芯片有根本不同,更注重延迟和吞吐量,并可能采用精度较低的架构,例如INT8[3] - 苹果与博通在设计“Baltra”时,可能会重点关注这些推理芯片的特性[3] 苹果的垂直整合与芯片产品线 - 苹果公司热衷于垂直整合,其庞大的定制芯片设计工作是这种模式的例证[2] - 除了广为人知的A系列和M系列芯片,苹果现在使用其自主研发的C1调制解调器芯片[3] - 公司可能还会推出一款基于其Apple Watch专用S系列芯片的衍生产品,用于计划于明年发布的AI智能眼镜中[3] 生产与部署时间线 - 定制AI芯片的实际部署预计将在2027年进行[2] - 苹果公司早在2025年10月就开始交付其美国制造的服务器[2]
明日(12月5日)!摩尔线程登陆A股 沐曦股份开启申购
新华财经· 2025-12-04 22:25
摩尔线程科创板上市 - 公司将于12月5日在科创板上市,发行价格为114.28元/股,对应2024年摊薄后静态市销率为122.51倍 [2] - 按发行价预估,上市时市值约为537.15亿元,本次公开发行7000万股新股,募集资金净额预计为75.76亿元,为年内募资金额最高的科创板新股 [2] - 公司成立于2020年,以全功能GPU为核心,提供加速计算基础设施和解决方案 [2] - 募集资金将用于新一代自主可控AI训推一体芯片、图形芯片、AI SoC芯片研发项目及补充流动资金 [2] - 财务数据显示,2022年至2024年营业收入分别为0.46亿元、1.24亿元、4.38亿元,归母净利润分别亏损18.94亿元、17.03亿元、16.18亿元 [2] - 2025年上半年实现营业收入7.02亿元,超过过去三年年度总和,归母净利润亏损2.71亿元 [2] 沐曦股份开启申购 - 公司将于12月5日开启申购,发行价格为104.66元/股,对应2024年摊薄后静态市销率为56.35倍 [3] - 按发行价格预计,上市时市值约为418.74亿元,本次发行数量为4010万股,占发行后总股本10.02% [3] - 预计募集资金总额41.97亿元,将用于新型高性能通用GPU、新一代AI推理GPU研发及产业化等项目 [3] - 公司是国内高性能通用GPU产品主要领军企业之一,致力于自主研发全栈高性能GPU芯片及计算平台 [3] - 旗舰产品曦云C系列训推一体GPU芯片在多项指标上达到国内领先水平,据测算,公司在2024年中国AI芯片市场份额约为1% [3] - 财务数据显示,2022年至2025年一季度营业收入分别为42.64万元、5302.12万元、7.4亿元和3.2亿元 [4] - 同期归属于母公司所有者的净利润分别为-7.77亿元、-8.71亿元、-14.09亿元和-2.32亿元,尚未实现盈利 [4] 行业动态 - 两家国产GPU公司摩尔线程与沐曦股份于同日(12月5日)分别进行科创板上市和申购 [1]
博通:AI 推理需求爆发,有望大幅上涨
美股研究社· 2025-11-28 19:06
人工智能生态系统转型 - 人工智能生态系统正从训练阶段向推理阶段转型,推理需求激增成为超大规模科技公司的强劲收入引擎 [1] - 数百万用户频繁与人工智能助手交互,使得推理成为OpenAI、谷歌等提供商的核心焦点,需要更多加速器、网络设备和互联产品以满足持续增长的需求 [1] - 博通、英伟达、字母表、微软等公司指出人工智能推理需求激增,这一快速增长将推动2026年下半年定制芯片需求上升 [1] 博通的竞争地位与机遇 - 博通凭借成功的关键要素,稳固其人工智能领域"明确老二"的地位,人工智能业务收入远超迈威尔和超威半导体等小型同行 [1][19] - 公司从推理增长曲线中看到机遇,推理领域的迫切需求可能会推动2026年下半年XPU需求加速增长 [5] - 首席执行官在最近一个季度强调,公司新增了一位客户,并获得了超过100亿美元的XPU订单,预计2026财年人工智能业务收入展望将显著改善 [5] 定制芯片的成本与性能优势 - 博通定制加速器在推理任务中的成本通常仅为英伟达GPU的数分之一,且其定制芯片的性能每一代都在持续提升 [2] - 大型科技公司通过优化算法可以从大型语言模型中榨取更高性能,这有助于降低成本同时提高特定工作负载的产出 [2] - 英伟达商用GPU的制造成本估计约为3000至5000美元,而售价却高达25000至30000美元,大型科技公司的目标是通过降低硬件成本和优化工作负载来削弱英伟达的定价权 [2] 网络产品与集群部署 - 博通致力于通过战斧6号交换机保持在网络领域的领先地位,这是行业首款102.4太比特每秒的以太网交换机,带宽较上一代翻倍 [9] - 战斧6号使10万个以上人工智能加速器的集群仅需两层架构即可部署,通过更低的延迟、更高的带宽和更低的功耗提供更出色的性能 [10] - 行业正从英伟达的GPU+InfiniBand锁定生态系统转向以太网,这一趋势利好博通,英伟达新的Spectrum-X以太网业务年化收入达100亿美元 [8] 财务表现与增长前景 - 第三季度营收达159.5亿美元,同比增长22%,环比增长6.3%,创季度营收历史新高,管理层给出第四季度营收指引为174亿美元,同比增长23.8% [11][12] - 人工智能半导体业务营收同比激增63%,达52亿美元,占半导体业务收入的57%,占公司总营收的33%,管理层指引第四季度人工智能业务收入为62亿美元,环比增长约19% [13] - 假设公司在2027财年能够维持超过60%的同比增长,那么其人工智能业务收入将接近540亿美元,占公司总营收的比例约为50% [5] 盈利能力与现金流 - 非GAAP每股收益同比增长36.3%,超过22%的营收增长,2026财年调整后每股收益预计同比增长37.9%,达9.31美元 [16] - 公司实现均衡的盈利能力,调整后息税折旧摊销前利润率为67.1%,调整后净利润率达52.7% [14][18] - 自由现金流同比增长46.6%,达70.2亿美元,自由现金流利润率为44%,现金储备达107亿美元,债务降至642亿美元 [18][22] 行业趋势与客户动态 - 大型科技公司在博通的定制芯片客户名单中占据重要地位,包括谷歌和元宇宙,字节跳动于去年夏天成为第三大客户,公司在第三季度还新增了一位客户 [2] - 行业正迈向百万级以上加速器集群的目标,公司三位超大规模客户(现已增至四位)均计划在2027年底前部署100万个XPU集群 [8] - 谷歌宣布其第七代张量处理单元Ironwood是首款专门为推理设计的TPU,提供两种配置,其中9216芯片的性能高达42.5艾字节每秒 [4]
从iPhone17热卖到“AI推理超级蓝海” 苹果(AAPL.US)悄然踏向新一轮牛市轨迹
智通财经网· 2025-09-30 12:43
iPhone 17系列需求分析 - iPhone 17系列交付周期为19天,远高于iPhone 16系列的5天初步交付周期,表明换机需求非常强劲[2] - 中国市场iPhone 17标准款发货日期最长,为25天,其他国际地区整体约为18天,凸显标准款需求之强劲[3] - iPhone 17 Pro交付时间为14天,iPhone 17 Pro Max交付时间则长达21天,Pro Max机型交付时间小幅高于去年[3] - 美国运营商渠道的iPhone 17 Pro交付周期仅约9天,优于苹果自营渠道的两到三周[3] - 中国市场因政府对低于6000元人民币的消费电子产品提供补贴以及iPhone Air供应不足,iPhone 17标准系列可能卖得非常好[3] - iPhone Air全球平均发货日期仅为三天,表明起始库存更高,苹果已预期到其强劲需求[4] 苹果公司市场表现与预期 - 自9月以来,苹果股价强势反弹超10%,分析师普遍看好股价冲击300美元大关[2] - 截至周一美国股市收盘,苹果股价收于254.430美元,市值稳定在3.8万亿美元,仅次于英伟达与微软[2] - 苹果生态的活跃设备已达23.5亿,系统层集成推理能力可使开发者触达海量终端用户[7] - Apple Intelligence优先本地运行,必要时通过Private Cloud Compute调用云端AI大模型,提供可验证透明性与最小数据驻留[7] AI推理市场前景 - 预计到2030年AI推理系统将带来万亿美元级别市场,企业侧推理成本规模保守估计约为1.3万亿美元,2025-2030年期间预期复合年增长率约为67%[5][6] - AI基础设施支出在2030年前将达到3万亿至4万亿美元,给英伟达等公司带来重大长期增长机遇[5] - 模型持续改进与更新迭代是关键的领先指标,超大规模资本开支可能是一个滞后指标[6] - 苹果被认为是人工智能推理革命的最佳入口之一,人工智能布局最优且最有望受益[6]
NPU,大有可为
半导体行业观察· 2025-08-28 09:14
AI推理市场趋势 - 全球AI推理市场规模预计从2024年106亿美元增长至2030年255亿美元 年均增长率达19% [2] - 行业正减少对GPU依赖 转向低功耗高效率的专用芯片NPU(神经处理单元) [2] - NPU因满足高推理吞吐量、低延迟和高能效需求而成为增长核心 [2] NPU技术竞争格局 - CPU和GPU市场进入技术成熟阶段 推理型AI半导体转向ASIC架构的NPU [2] - 美国初创公司Sambanova采用数据流架构NPU 集成专有软件覆盖LLM训练与推理 [3] - Grok量产专用推理芯片 通过云服务实现百万令牌级实时推理 商业模式聚焦LLM服务而非硬件销售 [3] 行业竞争战略 - 企业需确保能效显著优势 数据中心功耗已成AI应用主要瓶颈 [3] - 定制化市场成为关键策略 针对电信、金融、国防等行业定制推理NPU [3] - 硬件与软件生态整合成为核心竞争力 Sambanova通过捆绑模式获得政府及金融机构客户 [3]