内存计算
搜索文档
AWS买了一家芯片公司
半导体行业观察· 2025-10-11 09:27
公司核心交易与运营变更 - 以色列初创公司NeuroBlade的核心工程团队将加入AWS Annapurna Labs,此举标志着其独立运营的有效结束 [1] - 此次交易是公司发展历程中的重要里程碑,核心团队将在AWS引领下一代产品创新 [1][2] - 交易之外,公司已完成内部组织架构调整,软件和系统团队将专注于新篇章 [2] - NeuroBlade由首席执行官Elad Sity和首席技术官Eliad Hillel于2018年创立,两人曾是SolarEdge的早期员工 [1] - 公司迄今已融资1.1亿美元,投资者包括Corner Ventures、英特尔投资、Grove Ventures等 [1] 公司技术与产品定位 - NeuroBlade开发了一种新颖的数据分析架构,通过将计算直接集成到内存中来消除数据处理瓶颈 [2] - 其技术整合了专有硬件、软件和算法,形成安装在服务器群中的统一系统以加速大规模计算 [2] - 公司开发了专用半导体芯片SQL处理单元(SPU),用于加速SQL指令处理,该芯片插入主机服务器的PCIe总线 [3] - SPU技术可使分析工作负载的作业速度提高100倍或更多,从而降低成本并提高CPU核心使用效率 [3] - 该技术定位为数据分析领域的专用加速器,与x86 CPU用于通用应用、GPU用于AI形成互补,公司目标是成为“数据分析领域的Nvidia” [3][7] 市场合作与商业进展 - NeuroBlade正与所有大型超大规模数据中心运营商洽谈,并已与其中一家运营商签订了数千张SPU卡的合同 [4] - 公司与戴尔达成合作协议,在PowerEdge服务器中分销SPU卡产品 [5] - 公司曾与三星等驱动器制造商以及VAST Data等存储供应商讨论SPU的应用,但当前重点并非存储阵列市场 [6] - 公司首席商务官Lior Genzel Gal拥有丰富的行业经验,其此前所在公司Excelero被英伟达收购 [5] - 超大规模厂商的销售可能涉及数万个CPU,其市场规模远大于存储阵列供应商每年数百或数千的出货量 [6]
芯片初创公司,攻破内存墙
半导体行业观察· 2025-09-03 09:17
公众号记得加星标⭐️,第一时间看推送不会错过。 人工智能革命催生了对训练前沿模型的处理能力的巨大需求,而英伟达正用其高端 GPU 来满足这一 需 求 。 然 而 , 2025 年 人 工 智 能 突 然 转 向 推 理 和 代 理 人 工 智 能 , 暴 露 出 内 存 管 道 方 面 的 缺 口 , d- Matrix 希望通过其创新的 3D 堆叠数字内存计算 (3DIMC) 架构来解决这个问题,该架构已于上周在 Hot Chips 大会上进行了展示。 该公司由首席执行官 Sid Sheth 和首席技术官 Sudeep Bhoja 于 2019 年创立,两人均曾担任高速互 连开发商 Inphi Corp 的高管,该公司于 2020 年被 Marvell 以 100 亿美元收购。其目标是开发内存 计 算 芯 片 级 技 术 , 为 AI 推 理 带 来 比 传 统 DRAM 带 宽 更 大 的 内 存 , 且 成 本 远 低 于 高 带 宽 内 存 (HBM)。 Sheth 在领英上发帖称:"我们相信,AI 推理的未来不仅取决于对计算的重新思考,也取决于对内存 本身的重新思考。我们正在为新的内存计算范式 (3 ...
AMD收购两家公司:一家芯片公司,一家软件公司
半导体行业观察· 2025-06-06 09:12
AMD收购Untether AI - AMD收购AI推理芯片开发商Untether AI的工程师团队,以增强其AI编译器和内核开发能力,以及数字和SoC设计、设计验证和产品集成能力 [1] - 交易后Untether AI将不再提供或支持其speedAI产品和imAIgine软件开发套件 [1] - Untether AI成立于2018年,专注于AI推理领域,其关键差异化优势在于内存计算架构,可解决神经网络计算中90%的能耗来自于数据移动的问题 [6][9] - Untether AI的第二代内存架构speedAI240设备采用台积电7纳米工艺,具有2 petaflops的FP8性能和238 MB的SRAM内存,能效达每瓦30 teraflops [5] - speedAI240设备支持多种数据类型,与BF16相比准确度损失不到0.1%,吞吐量和能效提高四倍 [9] - 该架构具有可扩展性,可从1瓦设备扩展到基础设施级设备,支持PCI-Express卡和chiplet集成 [20] Untether AI技术细节 - speedAI240设备采用第二代内存库,配备1,435个1.35 GHz 7纳米RISC-V处理器核心 [10] - 通过添加各种指令对RISC-V芯片进行改造以适应AI推理需求 [13] - 采用独特的"肩袖"通信设计和高效片上网络(NOC)优化能源效率 [17] - 提供ImAIgine SDK,支持从TensorFlow和PyTorch等框架提取神经网络并自动量化 [22] AMD收购Brium - AMD同期收购软件公司Brium以强化开放AI软件生态系统 [24] - Brium团队在编译器技术、模型执行框架和AI推理优化方面具有专长,将增强AMD AI平台的效率和灵活性 [24] - 此次收购是AMD继收购Silo AI、Nod.ai和Mipsology后又一战略投资,旨在提升开源软件生态系统支持能力 [25] - Brium擅长在模型到达硬件前优化整个推理堆栈,减少对特定硬件配置的依赖 [25] - 该公司在MX FP4和FP6等新精度格式方面的专长将帮助AMD平台更高效处理训练和推理工作负载 [25]
这将是未来的芯片?
半导体行业观察· 2025-04-21 08:58
先进的逻辑技术 - 台积电推出全球最先进的2纳米CMOS逻辑平台N2,采用GAA纳米片晶体管,芯片密度增加1.15倍,速度提升15%,功耗降低30% [4] - 英特尔展示栅极长度6纳米、接触式多晶硅间距45纳米的RibbonFET CMOS晶体管,电子迁移率在硅厚度低于3纳米前不会下降 [6][7] - 台积电展示48纳米栅极间距全功能单片CFET反相器,n型和p型器件均具有74-76mV/V的良好亚阈值斜率 [11][13] - 北京大学团队构建100纳米栅长A-CNT MOSFET,饱和通态电流2.45mA/μm,峰值跨导3.7mS/μm,非本征截止频率302GHz [17][19] 存储器技术 - Kioxia团队开发新型4F2 DRAM,采用GAA IGZO垂直沟道晶体管,导通电流超过15μA/单元,关断电流1aA/单元 [27][29] - IMEC研究发现使用贫铟薄膜和限制工作波形占空比可缓解IGZO TFT阈值电压不稳定性 [33][35] - 台湾大学团队构建具有β-W电极的MFM电容器,与HZO表现出2.9%晶格失配度,实现无疲劳耐久性 [38][40] 内存计算 - 清华大学团队开发首款基于金属氧化物CFET的3D集成芯片,与2D CIM电路相比面积、延迟和能耗分别降低55.1%、24.8%和44.9% [41][43] - 3D FeNAND阵列将模拟CIM密度提高4,000倍,计算效率比2D阵列高1,000倍,MAC运算准确率达87.8% [45][47] 高频和功率器件 - 英特尔在300毫米GaN-on-TRSOI衬底上制造GaN MOSHEMT射频晶体管,截止频率fT=190GHz,fMAX=532GHz [47][49] - 弗吉尼亚理工大学团队构建横向Ga2O3 JFET,击穿电压超过10kV,导通电阻703mΩ·cm2,可在250℃下工作 [51][54] 传感与成像 - 首尔国立大学团队开发集成气体、气压和温度传感的智能多模设备,气体检测准确率97.8% [57][59] - 索尼实现单个芯片同时获取RGB图像和测距信息,采用1.0μm拜耳像素和4.0μm测距像素 [60][61] - 台湾清华大学团队构建双换能间隙CMOS-MEMS CMUT阵列,超声发射效率16.7kPa/V/mm²,接收灵敏度57mV/kPa [65][66] 多元化主题 - 三星通过计算机建模从3,888种硫族化物组合中筛选出18种候选材料用于SOM应用 [70][72] - DeepSim公司开发AI加速的多尺度原子到电路热模拟流程,可在10分钟内完成RISC-V内核纳米级温度预测 [72][73]
这将是未来的芯片?
半导体行业观察· 2025-04-21 08:58
先进的逻辑技术 - 纳米片晶体管和3D互补场效应晶体管(CFET)是延续摩尔定律的关键技术,纳米片架构比FinFET具有更好的静电控制、更高驱动电流和可变宽度,CFET通过堆叠n-FET和p-FET使晶体管密度翻倍[3] - 台积电发布2纳米CMOS逻辑平台(N2),采用GAA纳米片晶体管,芯片密度比3纳米平台(N3)增加1.15倍,速度提升15%同时功耗降低30%,计划2025年下半年量产[3][4] - 英特尔展示栅极长度6纳米、接触式多晶硅间距45纳米的RibbonFET晶体管,电子迁移率在硅厚度低于3纳米前不会下降,研究表明3纳米是RibbonFET的实际缩放极限[8][9] - 台积电构建业界首个48纳米栅极间距的全功能CFET反相器,采用背面接触技术,n型和p型器件均具有74-76mV/V的亚阈值斜率,为未来逻辑技术微缩铺平道路[14][15] 新兴逻辑器件材料 - 北京大学团队采用高密度定向碳纳米管阵列构建100纳米栅长MOSFET,创下2.45mA/μm饱和通态电流和302GHz截止频率的纪录,性能超过硅平面FET[23][25] - 使用钌源漏接触的WSe2 PMOS器件实现156mV/dec亚阈值斜率和132μA/μm漏极电流,展示二维材料在下一代电子器件中的潜力[31][33] 存储器技术突破 - Kioxia团队开发新型4F2 DRAM,采用GAA IGZO垂直沟道晶体管,导通电流超过15μA/单元,关断电流低至1aA/单元,成功构建275Mbit阵列展示高密度潜力[33][35] - IMEC研究发现IGZO TFT阈值电压不稳定性可通过贫铟薄膜和限制工作波形占空比缓解,为未来DRAM可靠性提升提供解决方案[39][41] - 台湾大学团队开发具有β-W电极的金属-铁电-金属电容器,与HZO材料配合实现无疲劳耐久性,为高性能存储器开辟道路[44][45] 内存计算创新 - 清华大学团队开发首款基于金属氧化物CFET的3D集成芯片,包含Si-CMOS逻辑层、RRAM层和OS-CFET层,与2D方案相比面积减少55.1%,延迟降低24.8%,能耗下降44.9%[48][50] - 3D FeNAND阵列将模拟内存计算密度提升4000倍,计算效率比2D阵列高1000倍,在边缘计算应用中实现87.8%准确率的乘法累加运算[50][52] 高频与功率器件 - 英特尔在300毫米GaN-on-TRSOI衬底上制造高性能GaN MOSHEMT晶体管,实现190GHz截止频率和532GHz最大振荡频率,推动6G通信发展[54][56] - 弗吉尼亚理工大学团队开发横向Ga2O3结栅场效应晶体管,击穿电压超过10kV,导通电阻低至703mΩ·cm2,首次展示250℃工作和3kV可靠性数据[58][59] 传感与成像技术 - 首尔国立大学开发集成气体、气压和温度传感的智能多模设备,利用内存计算实现97.8%气体检测准确率[65][67] - 索尼实现单芯片集成RGB像素和近红外测距像素,采用1.0μm拜耳像素和4.0μm测距像素,无视差获取高分辨率图像和深度信息[68][69] - 台湾清华大学团队开发双换能间隙CMOS-MEMS CMUT阵列,实现16.7kPa/V/mm²超声发射效率和57mV/kPa接收灵敏度[73][74] 研发方法创新 - 三星通过计算机建模从3888种硫族化物组合中筛选18种候选材料,加速仅选择器存储器技术开发[78][79] - DeepSim公司开发AI加速的多尺度热模拟流程,可在10分钟内完成从原子到电路级别的温度预测,解决2D/3D IC热管理挑战[81][82]