Workflow
半导体行业观察
icon
搜索文档
英唐智控,收购芯片公司
半导体行业观察· 2025-10-27 08:51
英唐智控并购活动 - 公司正在筹划通过发行股份等方式收购上海奥简微电子科技有限公司[2] - 公司此前已筹划通过发行股份及支付现金方式购买深圳市爱协生科技股份有限公司60.65%的股份并募集配套资金[4] - 公司股票因筹划收购爱协生事项自2024年11月15日起停牌[4] 标的公司奥简微电子概况 - 上海奥简微电子科技有限公司成立于2015年专注于高性能模拟及混合信号芯片开发设计[2] - 创始团队平均设计开发经验超过十五年产品广泛应用于通信基站服务器医疗设备等领域[2] 标的公司爱协生科技概况 - 深圳市爱协生科技股份有限公司成立于2011年是国家高新技术企业国家级专精特新"小巨人"企业[5] - 公司专注于人机交互领域芯片设计2022年营业额突破8亿元[5] - 公司产品布局包括AMOLED驱动芯片穿戴TDDI驱动芯片智能显控SoC等[5]
东方晶源:三大创新点工具破解先进制程良率瓶颈
半导体行业观察· 2025-10-27 08:51
当前,随着芯片工艺向先进节点快速演进,制程节点不断逼近物理极限,技术难度呈几何级 增长,叠加AI芯片高算力需求、Chiplet多芯片集成等技术趋势,芯片版图复杂度进一步指数 级提升,设计与制造环节的协同难度显著加大。 在此背景下,图形化(Patterning)相关的系统性良率损失已成为制约晶圆厂研发效率提 升、量产成本降低的核心瓶颈。 对于晶圆厂而言,先进制程的竞争焦点本质是良率的竞争,而良率突破的关键恰恰在于Patterning 环节的风险管控。尤其对国内行业来说,由于受限于只能依赖DUV光刻机开发先进工艺节点, Patterning相关的良率问题更显突出与紧迫,良率提升不再是"工艺优化项",而是直接关系企业生 存的"商业生死线"。 对此,DMC通过AI驱动的D2C(Design To Contour)引擎实现关键突破:绕开传统OPC的复杂耗 时流程,基于输入的设计版图根据产线制程信息直接快速、准确的预测光刻轮廓,将反馈效率提升 100倍以上。此外,DMC还通过"Pattern Grouping"技术,可针对代表性图形检测,大幅提升全芯 片检查效率,有效解决"设计端无法提前感知制造风险"的痛点。 综合来看, ...
EUV很难被颠覆,纳米压印也不行
半导体行业观察· 2025-10-27 08:51
文章核心观点 - 纳米压印光刻技术理论上可匹敌甚至超越EUV光刻,但在实际应用中存在严重挑战,特别是掩模寿命和缺陷问题,目前尚未准备好替代EUV用于先进芯片制造 [2][30][31] - 佳能是NIL技术最主要的商业推动者,但其工具在吞吐量、套刻精度和客户反馈方面均不及ASML的EUV工具 [7][28][37] - NIL技术在设备成本和功耗方面具有显著优势,但掩模相关的高成本和检测难题使其整体经济性面临挑战 [30][32] NIL 基础知识和历史 - 纳米压印光刻技术使用带图案的"印章"在树脂上压印图案,目标与光刻技术相同,都是将掩模图案转移到晶圆上 [3] - 最先进的纳米级NIL技术发明于1996年,其商业实体Molecular Imprints Inc于2001年成立,后于2014年被佳能收购 [5] - 佳能是唯一一家进军NIL技术的先进商业企业,中国竞争对手Prinano和由大学分拆的Nanonex在技术成熟度上远不及佳能 [7] 佳能NIL技术详细流程 - 佳能将其技术称为"J-FIL",流程包括使用喷墨打印机以优化液滴图案沉积光刻胶、用掩模压印、紫外线闪光固化树脂 [9] - 光刻胶涂覆过程经过优化,可在三分之一秒内完成,但此步骤成为限制晶圆吞吐量的关键路径 [11] - 压印过程采用掩模弯曲技术以确保更好的重复性和对称性,整个压印循环耗时约1.3秒,节省了曝光后烘烤步骤 [13] 掩模工艺流程 - NIL掩模版制作使用与DUV光学掩模版相同的空白材料,但需要以与晶圆所需尺寸相同的特征尺寸进行写入,这对掩模写入机要求极高 [16][19] - 采用"主模板→子模板→工作模板"的三步复制流程,因为直接使用电子束掩模写入工具制作每个工作模板耗时过长(至少8小时) [18] - NIL掩模版需要接近20纳米的特征尺寸,而光刻掩模版特征尺寸可放大4倍,这使得NIL掩模制作更具挑战性 [19] 佳能 NIL 工具架构和功能 - 佳能NIL机器拥有晶圆和掩模运动平台,移动精度均达到1纳米,采用干涉莫尔对准技术进行实时套准控制 [21][23][25] - 通过16个独立压电致动器校正低阶对准误差,并利用微镜阵列控制的激光选择性加热掩模版来校正高阶误差 [26] - 设备以4单元为一组销售,总吞吐量为每小时100片晶圆,远低于ASML的DUV工具(330 wph)和EUV工具(220 wph) [28] NIL 与 EUV 的比较 - NIL设备成本可能仅为EUV光刻机的十分之一,每片晶圆成本约为EUV的四分之一,功耗降低90%(NIL约100千瓦,EUV超过1兆瓦) [30] - NIL理论上可避免EUV的随机误差问题,但其在实际应用中的掩模寿命短(约50片晶圆)是致命弱点,而光刻掩模寿命远超10万片晶圆 [30][32] - 尽管有成本和功耗优势,但掩模相关的高成本和检测难题使NIL目前难以与EUV竞争 [32] NIL技术面临的主要挑战 - 掩模寿命短是最大挑战,纳米级三维结构非常脆弱,图案特征易断裂产生缺陷,目前尚无明确的解决方案或路线图 [32] - 套刻精度目前比EUV差约4倍,且NIL工具只能读取曝光区域角落的对准标记,而ASML工具可读取整个晶圆上多10倍的标记 [33][34] - 客户反馈表明NIL尚未准备就绪,关键客户如Kioxia和美光在测试中均指出掩模粗糙度等问题,认为NIL存在实际分辨率极限 [37]
成熟制程太卷了,联电要求降价
半导体行业观察· 2025-10-27 08:51
联电与世界先进的2026年价格谈判策略 - 联电已正式要求上游供应链自2026年起至少提出15%的降价方案,以应对成本上升与报价松动的双重风险 [2] - 联电意在通过向上游争取成本空间,再与下游客户谈判以稳住平均销售单价与现金流 [2] - 15%的降本要求涵盖化学品、特用气体、载板材料、耗材与维保服务等供应环节,已有材料厂考虑以“分阶段让利”换取两至三年长约与最低采购量 [2] 成熟制程晶圆代工行业竞争格局 - 中国大陆与东南亚地区成熟制程产能持续开出,报价压力不减,吸引中低阶芯片订单转移,迫使台厂在价格、交期、良率与技术服务全面应战 [2] - 2024年大陆芯片制造商产能增长15%,达每月885万片约当12吋晶圆,预计2025年将达到1,010万片 [6] - 研究机构判断,到2026年中国晶圆产能在成熟制程供给持续攀升,对台系成熟制程厂的“守价+长约”谈判构成长线压力 [6] 晶圆代工厂的应对策略与核心能力 - 晶圆代工厂需具备三大应对能力:在不侵蚀毛利的前提下守住价格底线、争取签订二至三年长期合约以换取订单可预测性、通过提供设计支援等附加服务深度绑定核心客户 [3] - 联电将聚焦特殊制程强化差异化,同时以“小幅让利换长约”策略维持稼动率 [3] - 世界先进凭借车用、电源管理IC、MCU等应用稳定,加上高良率与在地服务优势,积极争取与台系设计公司共开发、共验证 [3] 台湾晶圆代工厂的竞争优势 - 台厂具备三大优势:制程稳定度与交期可控、车用认证经验丰富能提供长期供货与可靠度保障、与IC设计及生产测试生态链紧密整合可快速支援设计修正与小量试产 [7] - 未来全球代工竞争将进入“量产规模”与“技术附加价值”并重的新阶段,台湾厂需从传统制造走向技术服务与方案整合 [7] - 成熟制程价格战预计将延续至少一年,但联电与世界先进若能成功透过“守价+长约”策略维持ASP与稼动率,加上特殊制程比重提升,整体营运仍有支撑 [7]
DRAM,走向9纳米
半导体行业观察· 2025-10-26 11:16
存储行业市场现状 - 存储厂商迎来十多年甚至二十多年来最美好的时光,行业进入上行周期 [2] - AI数据中心需求持续旺盛,HBM供不应求,同时库存见底,两大利好因素叠加 [2] - 市场繁荣为厂商的激进投资提供了底气,制程跨越有望在3-4年内实现突破,快于原本5-7年的周期 [23] DRAM工艺演进与10nm-class技术 - "10nm-class"是行业对10-19纳米工艺区间的统称,是当前DRAM制造的主流技术范畴和短期技术天花板 [2] - 10nm-class工艺已形成三代成熟量产节点:第一代1xnm(17-19纳米)、第二代1ynm(14-16纳米)、第三代1znm(11-13纳米) [3] - 后续规划的1anm、1bnm、1cnm三代工艺仍未跳出10nm-class范畴,主要通过优化单元维度提升密度和降低功耗 [3] - 最新的1dnm属于10nm-class范畴,目标在11纳米以下进一步优化单元结构,是现有技术框架内的极限优化版 [5] - DRAM因包含"1个晶体管+1个电容器"的特殊结构,工艺微缩在逼近10纳米以下时遇到物理极限,导致行业暂时无法突破10nm-class边界 [5] 突破10nm-class的挑战与9nm节点 - 9nm是行业首次明确突破10nm-class边界的尝试,目标将DRAM特征尺寸降至10纳米以下,以大幅提升每晶圆容量并降低单位GB成本 [5] - 9nm工艺下面临电容器体积减少导致数据稳定性下降、光刻精度和材料电学特性接近物理极限、单元密度更高导致读写速度可能下降等挑战 [6] - 9nm节点的竞争已超越技术比拼,演变为时间窗口、资本投入、客户绑定、专利布局的博弈,先发优势一旦形成可能在3-5年内难以被追赶 [23] 三星电子的技术策略 - 三星已将"9nm级"或称"0a nm"节点纳入中长期技术路线图,并计划采用全新的4F²单元结构,理论上可将单元面积缩小约33% [8] - 三星在研发9纳米DRAM时,不仅会开发4F²结构产品,还在准备基于现有6F²结构的版本,最终方案将在完成研发和评估后确定 [9][11] - 公司内部存在危机感,认为自10纳米第四代DRAM推出以来,未能在与SK海力士的较量中确立优势,因此在下一代DRAM研发中制定多种技术方向 [11] - 三星电子预计最早于2027年完成相关产品研发并开始提供样品,计划在三年内实现量产 [11] SK海力士的技术策略 - SK海力士计划在其新的1c DRAM上使用5层或更多EUV层,并计划将1d和0a等所有下一代产品都使用EUV [12][13] - 公司积极应对高数值孔径EUV技术,计划最早在2026年推出高数值孔径EUV设备,其数值孔径可达0.55,高于传统EUV的0.33 [13] - 2024年底,SK海力士在其清州M16厂区安装了全球首台用于DRAM生产的ASML TWINSCAN EXE:5200B High-NA EUV光刻机,旨在抢占下一代光刻技术制高点 [13] - 公司开发下一代DRAM架构4F² VG平台,核心创新包括垂直栅极晶体管,该技术可能在2027年前后与9nm级节点同步导入量产 [13] 美光科技的技术策略 - 美光在DRAM制程推进上采取"跳跃式"路径,正在评估跳过第八代10nm级工艺,直接从当前节点跃进至9nm级或更先进节点 [14] - 公司更强调通过更大胆架构直接向3D或不同的堆叠/键合方案转型,来规避中间代的成本与时间耗费 [15] - 美光在公开专利与宣讲中更多强调集成/系统层面的优化,并在学术期刊与专利库中有涉及层间键合、异质集成的申请 [18] - 若采取跳过传统代序的策略存在较大风险,需在成本/良率上快速取得突破以抵消放弃逐步迭代所丧失的经验 [18] High-NA EUV光刻技术发展 - ASML高数值孔径EUV光刻系统订单激增,存储芯片订单占比从第二季度的16%激增至47%,几乎与逻辑芯片平分秋色 [19] - High-NA EUV将数值孔径从0.33提升至0.55,单次曝光分辨率可达8纳米,而当前Low-NA EUV设备分辨率为13纳米,可实现尺寸缩小1.7倍的晶体管 [21] - 采购High-NA设备仅是开始,真正挑战在于将其转化为可量产制造能力,涉及配套镜头、光源、掩模体系及厂房基础设施的全面改造 [21] - ASML预测DRAM制造商将在2030年代过渡到High-NA EUV设备的使用 [22] 产业链影响与未来展望 - 设备厂商将因技术代际跨越获得新一轮资本开支红利,材料供应商需开发适配新架构的材料,封装测试厂商要应对更严苛的要求 [24] - 整个半导体产业链都将因存储器的制程跃迁而重新洗牌 [24] - 存储产业进入罕见的"需求与投资双轮驱动"格局,为厂商激进投资提供底气 [23]
台积电,压力陡升
半导体行业观察· 2025-10-26 11:16
OpenAI的芯片合作战略 - OpenAI与AMD签署协议,计划在未来几年内生产6千兆瓦(GW)的GPU,首个1 GW部署将于2026年底启动[3] - OpenAI与博通合作构建10千兆瓦的AI加速器和以太网系统,首批部署同样于2026年下半年开始,持续到2029年[3] - AMD首席财务官预计与OpenAI的合作未来将带来"数百亿美元的收入"[3] 芯片合作的技术实质与影响 - 博通并非从零开始"设计"芯片,而是根据OpenAI的规格,将其已有的IP模块和预设计芯片部件进行组合[4] - 合作生产的AI加速器旨在更高效地运行OpenAI已训练好的模型(推理过程),其定制化好处主要惠及OpenAI自身,而非整个AI行业[4] - 使用千兆瓦级别作为芯片讨论单位,部分原因是实现宏伟目标所需的芯片具体数量尚不明确,估算时需考虑芯片功耗及等额的冷却功耗[5] - OpenAI通过自产芯片可节省成本(相比从NVIDIA购买利润率更低)、提升性能速度,并获得多元化的供应商选择,避免依赖单一供应商[5] 台积电(TSMC)的行业地位与瓶颈 - 台积电是几乎所有AI芯片的实际制造商,被描述为"整个全球经济最大的单点故障"[6][8] - 台积电在先进3纳米制程技术领先,其成功关键在于对极紫外光刻技术的大力支持以及生产的高良率芯片[8][9][10] - 公司2025年第二季度净利润达128亿美元,随后一个季度净利润高达147.6亿美元[10] - 台积电超过四分之三的业务来自北美客户,其产能"非常紧张",在可预见的未来仍将如此[10] - 任何轻微中断(如地震)都可能对晶圆产量产生负面影响,且没有多余产能吸收冲击,例如NVIDIA曾因台积电产能排期问题需等待九个月[11] 台积电的产能扩张计划 - 台积电正投入巨资提升产能,其位于总部附近的A14晶圆厂预计近期动工,2028年投产,将采用A14工艺节点生产1.4纳米芯片[11] - 亚利桑那州工厂首厂将于2025年初投入运营生产4纳米芯片,NVIDIA和台积电已展示在该厂生产的首款Blackwell晶圆[11] - 亚利桑那州工厂规划从三座扩展到六座,公司承诺加大投资使美国工厂的工艺流程仅比中国台湾工厂落后一代[12] - 减少对台积电尖端制造业的依赖需要多年甚至几十年时间,台积电目前仍是行业的薄弱环节[12]
清华大学 集成电路学院在 MICRO 2025 成功举办“Ventus:基于 RISC-V 的高性能开源 GPGPU”学术教程
半导体行业观察· 2025-10-26 11:16
项目总览 - 清华大学团队在MICRO 2025会议上成功组织了关于开源GPGPU"乘影"(Ventus)的学术教程[1][15] - 项目基于RISC-V及其向量扩展构建高性能开源通用图形处理器(GPGPU)[1][15] - 项目布局完整,涵盖指令集、硬件架构、编译器、仿真器及验证工具等全栈技术[3][15] 核心架构设计 - 从指令、数据、线程三个并行维度阐明GPGPU作为硬件多线程SIMD处理器的本质[5][16] - 在RISC-V Vector扩展基础上构建功能完备的SIMT架构[5][16] - 微架构实现包括CTA调度器、Core pipeline、warp scheduler等核心组件[5][16] 缓存与内存管理 - 缓存子系统在RISC-V RVWMO内存模型下采用释放一致性引导的缓存一致性机制[6][16] - 通过快通路与稳健通路的分工兼顾低延迟与全局正确性[6][16] - MMU设计将开销控制在15%–25%之间,L1 DTLB命中率超过95%,L2 TLB命中率超过85%[6][16] AI加速单元 - 新一代多精度可复用张量核心支持从FP16到INT4及MX FP8/FP6/FP4等多种新兴数据精度[7][16] - 采用硬件资源复用设计,通过异质乘法器的动态复用节省硬件面积[7] - 集成Tensor Core后,特定负载的指令数与执行周期数分别实现69.1%与68.4%的优化[7][16] 验证框架 - GVM框架是面向Ventus GPGPU的指令级软硬件协同差分验证框架[8][17] - 通过将RTL与定制化指令集模拟器进行差分比较,有效发现多处细微BUG[8][9][17] - 在SIMT语义下引入软件ROB解决GPGPU指令乱序完成带来的验证挑战[8][17] 软件工具链 - 支持OpenCL 2.0 profile,已通过超过85%的OpenCL一致性测试[10][17] - 基于Triton的AI算子库为ML工程师提供友好方式开发高效算子[10][17] - 工具链包含Compiler、Runtime、Driver、Simulator等核心模块,实现从硬件验证到上层程序运行的全流程支持[11][17] 实践演示与验证 - 提供交互式Jupyter网页指导,详细介绍项目开源仓库的组件构成和部署方法[12][17] - 基于VCU128 FPGA构建验证平台,集成Ventus GPGPU核心(1SM 8warp 16thread@50MHz)[13][17] - 成功运行向量加法、高斯消元和MNIST推理等关键测试,完成从仿真到实际硬件加速的全流程验证[13][17]
AMD,起源于这颗芯片?
半导体行业观察· 2025-10-26 11:16
文章核心观点 - AMD通过逆向工程英特尔8080处理器,成功开发并量产了Am9080芯片,这为公司早期在PC CPU制造领域的发展提供了关键的财务和业务基础 [4][6][7] Am9080的起源与开发 - Am9080是对英特尔8080处理器进行逆向工程和克隆的产物,其开发基于三位工程师拍摄的约400张英特尔8080预生产样品的详细图像 [4][5] - AMD利用其开发的N沟道MOS工艺制造该处理器,并于1974年开始销售,但正式量产上市是在1975年 [6] 产品的财务影响与商业模式 - 单个Am9080处理器的制造成本仅为50美分,但公司能以每片700美元的价格出售给军方客户,获得了极高的利润率 [7] - 量产这些处理器为公司在PC CPU制造领域的立足提供了巨大的财务跳板 [2] 与英特尔的协议与合作 - 1976年,AMD与英特尔签署了交叉许可协议,成为其处理器的“第二来源”,该协议要求AMD在签约时向英特尔支付2.5万美元,并每年支付7.5万美元授权费 [8] - 该协议免除了双方过去侵权行为的责任,并为1982年的扩展协议奠定了基础,后者允许AMD生产自己的x86 PC处理器 [8] 产品技术规格与优势 - Am9080有多个版本,时钟频率范围从2.083 MHz到4.0 MHz,工作温度范围从0-70摄氏度到符合军用标准的-70至125摄氏度 [10] - 得益于更先进的N沟道MOS制造工艺,Am9080的芯片尺寸比英特尔8080更小,且支持更高的时钟频率,英特尔8080的时钟频率最高仅为3.125 MHz [10]
高端车规MCU,芯驰官宣:规模化量产
半导体行业观察· 2025-10-26 11:16
文章核心观点 - 芯驰科技E3系列MCU旗舰产品E3650正式进入规模化量产,标志着本土芯片企业在高端车规MCU领域实现对海外巨头垄断的突破,并在下一代汽车E/E架构中占据引领地位 [1][3][5] 产品发布与市场意义 - E3650于10月24日宣布正式进入规模化量产,并完成AEC-Q100 Grade 1可靠性认证,开始接受客户量产订单 [1] - 该产品的量产打破了由瑞萨、英飞凌、意法半导体和恩智浦等海外巨头长期垄断的车规MCU市场格局,尤其是在域控领域 [1] 产品性能与技术优势 - E3650采用22nm车规工艺,相较于竞品普遍采用的28nm或40nm工艺,构筑了“代际鸿沟”,带来更强性能与更优能效 [2][5] - 主应用内核为(4+4)x Cortex-R52+,主频高达600MHz,高于瑞萨U2A16的400MHz、英飞凌TC399的300MHz和意法半导体SR6G6的500MHz [2] - 配备600MHz信息安全专用CPU,支持国密算法硬件加速并满足ISO21434标准,而部分国际竞品仅100-200MHz且不满足该标准或不支持国密算法 [2] - 嵌入式存储为16MB,SRAM超过4MB,高于竞品的2.5MB至3.8MB,可用I/O数量超过350个,显著多于竞品的约280至320个 [2] - 芯片尺寸为19x19mm,比部分竞品25x25mm的封装面积减少40% [2][4] - 内置玄武超安全HSM模块和自研SSDPE通信加速引擎,实现CAN FD零丢包传输,满足ISO 21434信息安全等级和ASIL D功能安全要求 [4][5] 客户应用与市场进展 - E3650已获得多个定点项目,成为新一代整车区域控制器和域控领域的核心解决方案 [3] - 产品已应用于面向2027和2028年新一代E/E架构平台的区域控制器主控MCU、智驾和舱驾一体控制器主控MCU以及智能线控底盘域控MCU [6] - E3系列已整体完成数百万片的出货,覆盖50多款主流量产车型,广泛应用于区域控制、车身控制、电驱、BMS、智能底盘、ADAS等核心领域 [17] 典型应用场景解决方案 - 在区域控制器场景中,E3650以“单芯片重构区域控制”为核心,凭借多核高性能配置和成熟基础软件,帮助客户实现软件快速移植和硬件设计极简化,显著优化BOM成本 [9] - 在舱驾一体中央计算单元场景中,E3650封装面积仅为同档位竞品BGA516封装的40%,在增加PCB制程的前提下减少IO扩展芯片,实现系统化降本并避免重新开模投入 [10][11] 行业趋势与产品定位 - 汽车E/E架构正向“中央计算+区域控制器”演进,核心诉求是通过数量更少、性能更强的控制器实现更高程度集成 [13] - E3650凭借其强大的实时处理能力、丰富I/O资源和卓越通信性能,成为完全区域化架构和半区域化架构两种主流路径的“通用解”和“最优解” [15] - 公司围绕E3650构建了完整的一站式量产解决方案,包括配套高功能安全等级定制化PMIC、高效IO扩展芯片、成熟的虚拟化软件以及完善的开发工具链 [15]
这家AI芯片独角兽,考虑出售
半导体行业观察· 2025-10-26 11:16
公司概况与最新动态 - 人工智能芯片初创公司SambaNova Systems因融资困难,正考虑出售公司[2] - 公司成立于2017年,总部位于美国加州,曾致力于为训练和推理打造基于统一架构的AI芯片[2] - 公司在2023年发布了一款专为大语言模型微调和推理设计的芯片[2] - 公司上一轮融资是2021年的D轮融资,融资总额超过11亿美元,估值超过50亿美元[2] - 2024年4月下旬,公司大幅偏离最初目标,放弃训练雄心,裁掉15%的员工,将全部精力转向AI推理[3] 团队与技术优势 - 公司由芯片和AI/ML领域的三位传奇人物共同创立:CEO Rodrigo Liang、Kunle Olukotun和Christopher Ré[3] - 公司内部承接了大量Sun Microsystems芯片部门的员工,拥有丰富的芯片开发经验和供应链管理能力[3] - 过去两年中,团队围绕大模型技术路线培养了数十名LLM模型工程师,并在服务部署环节建立了先发优势[3] - 公司曾投入大量时间和精力实现高效的训练,针对训练设计和优化了硬件和软件功能[4][7] - 分析师曾认为公司凭借单芯片满足推理和训练市场需求,相较于Groq等竞争对手拥有独特优势[4][6] 战略转型与行业趋势 - 公司战略转型的主要原因包括:推理是更容易解决的问题、推理市场可能比训练市场更大、英伟达在AI训练芯片领域占据绝对主导地位[4][7] - 许多分析师认为,人工智能推理市场规模可能是训练市场的十倍[4] - 公司的转变反映了AI芯片领域的一个普遍趋势,即从训练转向推理,Groq和Cerebras等公司也曾做出类似调整[3][5][6] - 推理过程中无需存储梯度,激活函数使用后可丢弃,减少了内存占用,降低了芯片内存层次结构的复杂性[4] - 推理所需的芯片间联网相对简单,更适合许多初创公司的AI芯片网络功能[4]