内存计算
搜索文档
这一创新,打破内存微缩死局!
半导体芯闻· 2026-01-23 17:38
文章核心观点 人工智能工作负载驱动了内存技术的创新,特别是对低功耗、高密度内存的需求日益增长,这推动了以非晶氧化物半导体(如IGZO)为代表的新材料在DRAM、SRAM替代方案及内存计算等领域的应用探索,旨在解决传统内存的微缩挑战、漏电与功耗问题,并实现与先进CMOS工艺的后端集成[1][11] DRAM技术演进与氧化物半导体的应用 - **人工智能数据中心的需求导致DRAM短缺**,尽管有RRAM等新技术探索,DRAM仍是大多数应用的首选[1] - **DRAM微缩面临挑战**,行业希望通过垂直结构提高密度,并采用低漏电晶体管(如非晶氧化物半导体IGZO)来降低大型存储阵列的刷新功耗[1] - **IGZO材料具有优势**,其极低的漏电流和相对容易、低成本的沉积工艺,使其适用于堆叠器件[1] - **集成工艺存在热稳定性挑战**,例如在DRAM所需的高温下,IGZO退火可能导致锌迁移和氧空位,但通过优化电极材料(如无锌IGO)和工艺,器件在550°C以上仍能保持稳定[2] - **多家公司展示3D DRAM集成方案**:长鑫存储通过优化沉积工艺、减少氢含量、使用抗氧化界面层和改进栅极绝缘层,成功制备出导通电流为60.9 μA/μm、亚阈值摆幅为80 mV/dec的双栅晶体管[3];Kioxia展示了一种3D DRAM氧化物通道替换工艺,其原型单元在45nm栅极长度下实现了超过30μA/单元的高导通电流和优于10^13的开关比[5] 作为SRAM替代方案的增益单元存储器 - **氧化物半导体可用于无电容“增益单元”存储器**,这是一种潜在的SRAM替代方案,利用氧化物半导体的低漏电延长数据保持时间,同时利用硅的速度优势[6] - **混合设计实现性能提升**:斯坦福大学、英伟达和台积电的研究人员构建的256×256阵列,与高密度SRAM相比,密度提高了3.6倍,能耗降低了15%[6] - **自对准设计进一步优化性能**:佐治亚理工学院的研究展示了一种完全自对准的3T0C设计,相比于晶体管重叠的单元,保持性能提高了10倍,有效容量提高了一倍,并将能耗-延迟-面积乘积降低了75%至80%[8] - **尝试提升速度**:日本半导体能源实验室使用晶体氧化铟(非非晶)制造器件,实现了5纳秒的读写速度和超过3600秒(1小时)的数据保持时间[8] 面向内存计算的非易失性存储器 - **内存计算旨在解决内存带宽问题**,但许多基于模拟存储器(如RRAM)的设计存在需要模数转换等局限性[9] - **氧化物半导体助力非易失性电容存储**:佐治亚理工学院与台积电合作,将掺钨氧化铟与铁电氧化铪锆结合,在40nm CMOS工艺上构建了存储元件,实现了超过10^9次的非破坏性读取耐久性和优于10^4秒(2.78小时)的保持时间[9] - **氧化物半导体使FeFET存储器后端集成成为可能**:由于硅的热要求,硅沟道FeFET难以后端集成;三星研究人员采用IGZO作为沟道材料,并通过氧气退火稳定氧空位,最终获得了1.6 V的宽存储窗口,且耐久性超过10^12次循环[9]
AWS买了一家芯片公司
半导体行业观察· 2025-10-11 09:27
公司核心交易与运营变更 - 以色列初创公司NeuroBlade的核心工程团队将加入AWS Annapurna Labs,此举标志着其独立运营的有效结束 [1] - 此次交易是公司发展历程中的重要里程碑,核心团队将在AWS引领下一代产品创新 [1][2] - 交易之外,公司已完成内部组织架构调整,软件和系统团队将专注于新篇章 [2] - NeuroBlade由首席执行官Elad Sity和首席技术官Eliad Hillel于2018年创立,两人曾是SolarEdge的早期员工 [1] - 公司迄今已融资1.1亿美元,投资者包括Corner Ventures、英特尔投资、Grove Ventures等 [1] 公司技术与产品定位 - NeuroBlade开发了一种新颖的数据分析架构,通过将计算直接集成到内存中来消除数据处理瓶颈 [2] - 其技术整合了专有硬件、软件和算法,形成安装在服务器群中的统一系统以加速大规模计算 [2] - 公司开发了专用半导体芯片SQL处理单元(SPU),用于加速SQL指令处理,该芯片插入主机服务器的PCIe总线 [3] - SPU技术可使分析工作负载的作业速度提高100倍或更多,从而降低成本并提高CPU核心使用效率 [3] - 该技术定位为数据分析领域的专用加速器,与x86 CPU用于通用应用、GPU用于AI形成互补,公司目标是成为“数据分析领域的Nvidia” [3][7] 市场合作与商业进展 - NeuroBlade正与所有大型超大规模数据中心运营商洽谈,并已与其中一家运营商签订了数千张SPU卡的合同 [4] - 公司与戴尔达成合作协议,在PowerEdge服务器中分销SPU卡产品 [5] - 公司曾与三星等驱动器制造商以及VAST Data等存储供应商讨论SPU的应用,但当前重点并非存储阵列市场 [6] - 公司首席商务官Lior Genzel Gal拥有丰富的行业经验,其此前所在公司Excelero被英伟达收购 [5] - 超大规模厂商的销售可能涉及数万个CPU,其市场规模远大于存储阵列供应商每年数百或数千的出货量 [6]
芯片初创公司,攻破内存墙
半导体行业观察· 2025-09-03 09:17
文章核心观点 - 人工智能工作负载正从训练转向推理和代理AI,这暴露了传统计算架构在内存带宽和容量上的瓶颈,即“内存墙”问题 [2] - d-Matrix公司致力于通过其创新的3D堆叠数字内存计算架构来解决AI推理的内存瓶颈问题,旨在实现比传统HBM内存更高的带宽和能效,同时降低成本 [2][5] 行业背景与趋势 - 2025年人工智能焦点转向推理和代理AI,对处理能力的需求暴露出内存管道的缺口 [2] - 行业基准显示,计算性能每两年增长约3倍,而内存带宽仅增长约1.6倍,导致处理器因等待数据而闲置的差距日益扩大 [8] - 基于GPU的传统高性能计算架构擅长训练大型语言模型,但并非运行AI推理工作负载的理想选择 [6] d-Matrix公司概况 - 公司由首席执行官Sid Sheth和首席技术官Sudeep Bhoja于2019年创立,两位创始人均曾担任高速互连开发商Inphi Corp的高管,该公司于2020年被Marvell以100亿美元收购 [2] - 公司目标是为AI推理开发内存计算芯片级技术,提供比传统DRAM更大的内存带宽,且成本远低于高带宽内存 [2] 核心技术:3DIMC架构 - 3DIMC指三维堆叠数字内存计算,通过垂直堆叠内存并与计算芯片紧密集成,旨在显著降低延迟、提升带宽并实现新的效率提升 [2][8] - 该技术采用LPDDR5内存,并通过中介层将数字内存计算硬件连接到内存,DIMC引擎使用改进的SRAM单元,在内存阵列内部执行计算 [3] - 其Apollo计算核心包含八个DIMC单元,可并行执行64×64矩阵乘法,支持INT8、INT4和块浮点等多种数值格式 [3] - 公司预计3DIMC将使AI推理工作负载的内存带宽和容量提高几个数量级 [5] 产品演进与性能目标 - 公司现有旗舰产品Corsair采用PCIe Gen5规格,具有150 TB/s的超高内存带宽 [7] - 下一代架构Raptor将融入3DIMC技术,目标是在运行AI推理工作负载时,与未来的HBM4相比,实现10倍内存带宽提升和10倍能效提升 [5][9] - 公司认为这些提升是阶跃式的改进,将重新定义大规模推理的可能性 [5][9] 市场预测与机遇 - 早在2022年底ChatGPT推出前,公司就已预见大型语言模型将催生对更大、更快内存的需求 [5] - 公司联合创始人Sid Sheth在2022年预测,Transformer模型将成为未来5到10年AI计算的主要工作负载,并最终导致AI推理工作负载激增 [6] - 到2025年,从AI训练到AI推理的重大转变正在发生,代理AI预计将在未来几年推动巨额投资 [7]
AMD收购两家公司:一家芯片公司,一家软件公司
半导体行业观察· 2025-06-06 09:12
AMD收购Untether AI - AMD收购AI推理芯片开发商Untether AI的工程师团队,以增强其AI编译器和内核开发能力,以及数字和SoC设计、设计验证和产品集成能力 [1] - 交易后Untether AI将不再提供或支持其speedAI产品和imAIgine软件开发套件 [1] - Untether AI成立于2018年,专注于AI推理领域,其关键差异化优势在于内存计算架构,可解决神经网络计算中90%的能耗来自于数据移动的问题 [6][9] - Untether AI的第二代内存架构speedAI240设备采用台积电7纳米工艺,具有2 petaflops的FP8性能和238 MB的SRAM内存,能效达每瓦30 teraflops [5] - speedAI240设备支持多种数据类型,与BF16相比准确度损失不到0.1%,吞吐量和能效提高四倍 [9] - 该架构具有可扩展性,可从1瓦设备扩展到基础设施级设备,支持PCI-Express卡和chiplet集成 [20] Untether AI技术细节 - speedAI240设备采用第二代内存库,配备1,435个1.35 GHz 7纳米RISC-V处理器核心 [10] - 通过添加各种指令对RISC-V芯片进行改造以适应AI推理需求 [13] - 采用独特的"肩袖"通信设计和高效片上网络(NOC)优化能源效率 [17] - 提供ImAIgine SDK,支持从TensorFlow和PyTorch等框架提取神经网络并自动量化 [22] AMD收购Brium - AMD同期收购软件公司Brium以强化开放AI软件生态系统 [24] - Brium团队在编译器技术、模型执行框架和AI推理优化方面具有专长,将增强AMD AI平台的效率和灵活性 [24] - 此次收购是AMD继收购Silo AI、Nod.ai和Mipsology后又一战略投资,旨在提升开源软件生态系统支持能力 [25] - Brium擅长在模型到达硬件前优化整个推理堆栈,减少对特定硬件配置的依赖 [25] - 该公司在MX FP4和FP6等新精度格式方面的专长将帮助AMD平台更高效处理训练和推理工作负载 [25]
这将是未来的芯片?
半导体行业观察· 2025-04-21 08:58
先进的逻辑技术 - 台积电推出全球最先进的2纳米CMOS逻辑平台N2,采用GAA纳米片晶体管,芯片密度增加1.15倍,速度提升15%,功耗降低30% [4] - 英特尔展示栅极长度6纳米、接触式多晶硅间距45纳米的RibbonFET CMOS晶体管,电子迁移率在硅厚度低于3纳米前不会下降 [6][7] - 台积电展示48纳米栅极间距全功能单片CFET反相器,n型和p型器件均具有74-76mV/V的良好亚阈值斜率 [11][13] - 北京大学团队构建100纳米栅长A-CNT MOSFET,饱和通态电流2.45mA/μm,峰值跨导3.7mS/μm,非本征截止频率302GHz [17][19] 存储器技术 - Kioxia团队开发新型4F2 DRAM,采用GAA IGZO垂直沟道晶体管,导通电流超过15μA/单元,关断电流1aA/单元 [27][29] - IMEC研究发现使用贫铟薄膜和限制工作波形占空比可缓解IGZO TFT阈值电压不稳定性 [33][35] - 台湾大学团队构建具有β-W电极的MFM电容器,与HZO表现出2.9%晶格失配度,实现无疲劳耐久性 [38][40] 内存计算 - 清华大学团队开发首款基于金属氧化物CFET的3D集成芯片,与2D CIM电路相比面积、延迟和能耗分别降低55.1%、24.8%和44.9% [41][43] - 3D FeNAND阵列将模拟CIM密度提高4,000倍,计算效率比2D阵列高1,000倍,MAC运算准确率达87.8% [45][47] 高频和功率器件 - 英特尔在300毫米GaN-on-TRSOI衬底上制造GaN MOSHEMT射频晶体管,截止频率fT=190GHz,fMAX=532GHz [47][49] - 弗吉尼亚理工大学团队构建横向Ga2O3 JFET,击穿电压超过10kV,导通电阻703mΩ·cm2,可在250℃下工作 [51][54] 传感与成像 - 首尔国立大学团队开发集成气体、气压和温度传感的智能多模设备,气体检测准确率97.8% [57][59] - 索尼实现单个芯片同时获取RGB图像和测距信息,采用1.0μm拜耳像素和4.0μm测距像素 [60][61] - 台湾清华大学团队构建双换能间隙CMOS-MEMS CMUT阵列,超声发射效率16.7kPa/V/mm²,接收灵敏度57mV/kPa [65][66] 多元化主题 - 三星通过计算机建模从3,888种硫族化物组合中筛选出18种候选材料用于SOM应用 [70][72] - DeepSim公司开发AI加速的多尺度原子到电路热模拟流程,可在10分钟内完成RISC-V内核纳米级温度预测 [72][73]
这将是未来的芯片?
半导体行业观察· 2025-04-21 08:58
先进的逻辑技术 - 纳米片晶体管和3D互补场效应晶体管(CFET)是延续摩尔定律的关键技术,纳米片架构比FinFET具有更好的静电控制、更高驱动电流和可变宽度,CFET通过堆叠n-FET和p-FET使晶体管密度翻倍[3] - 台积电发布2纳米CMOS逻辑平台(N2),采用GAA纳米片晶体管,芯片密度比3纳米平台(N3)增加1.15倍,速度提升15%同时功耗降低30%,计划2025年下半年量产[3][4] - 英特尔展示栅极长度6纳米、接触式多晶硅间距45纳米的RibbonFET晶体管,电子迁移率在硅厚度低于3纳米前不会下降,研究表明3纳米是RibbonFET的实际缩放极限[8][9] - 台积电构建业界首个48纳米栅极间距的全功能CFET反相器,采用背面接触技术,n型和p型器件均具有74-76mV/V的亚阈值斜率,为未来逻辑技术微缩铺平道路[14][15] 新兴逻辑器件材料 - 北京大学团队采用高密度定向碳纳米管阵列构建100纳米栅长MOSFET,创下2.45mA/μm饱和通态电流和302GHz截止频率的纪录,性能超过硅平面FET[23][25] - 使用钌源漏接触的WSe2 PMOS器件实现156mV/dec亚阈值斜率和132μA/μm漏极电流,展示二维材料在下一代电子器件中的潜力[31][33] 存储器技术突破 - Kioxia团队开发新型4F2 DRAM,采用GAA IGZO垂直沟道晶体管,导通电流超过15μA/单元,关断电流低至1aA/单元,成功构建275Mbit阵列展示高密度潜力[33][35] - IMEC研究发现IGZO TFT阈值电压不稳定性可通过贫铟薄膜和限制工作波形占空比缓解,为未来DRAM可靠性提升提供解决方案[39][41] - 台湾大学团队开发具有β-W电极的金属-铁电-金属电容器,与HZO材料配合实现无疲劳耐久性,为高性能存储器开辟道路[44][45] 内存计算创新 - 清华大学团队开发首款基于金属氧化物CFET的3D集成芯片,包含Si-CMOS逻辑层、RRAM层和OS-CFET层,与2D方案相比面积减少55.1%,延迟降低24.8%,能耗下降44.9%[48][50] - 3D FeNAND阵列将模拟内存计算密度提升4000倍,计算效率比2D阵列高1000倍,在边缘计算应用中实现87.8%准确率的乘法累加运算[50][52] 高频与功率器件 - 英特尔在300毫米GaN-on-TRSOI衬底上制造高性能GaN MOSHEMT晶体管,实现190GHz截止频率和532GHz最大振荡频率,推动6G通信发展[54][56] - 弗吉尼亚理工大学团队开发横向Ga2O3结栅场效应晶体管,击穿电压超过10kV,导通电阻低至703mΩ·cm2,首次展示250℃工作和3kV可靠性数据[58][59] 传感与成像技术 - 首尔国立大学开发集成气体、气压和温度传感的智能多模设备,利用内存计算实现97.8%气体检测准确率[65][67] - 索尼实现单芯片集成RGB像素和近红外测距像素,采用1.0μm拜耳像素和4.0μm测距像素,无视差获取高分辨率图像和深度信息[68][69] - 台湾清华大学团队开发双换能间隙CMOS-MEMS CMUT阵列,实现16.7kPa/V/mm²超声发射效率和57mV/kPa接收灵敏度[73][74] 研发方法创新 - 三星通过计算机建模从3888种硫族化物组合中筛选18种候选材料,加速仅选择器存储器技术开发[78][79] - DeepSim公司开发AI加速的多尺度热模拟流程,可在10分钟内完成从原子到电路级别的温度预测,解决2D/3D IC热管理挑战[81][82]