架构革新

搜索文档
在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer
机器之心· 2025-07-26 17:32
机器之心原创 作者:张倩 视频中的这个灵巧手是由一个 离线的多模态大模型 驱动 的。虽然模型只有 3B 大小,但部署到端侧后,无论是对话效果还是延迟几乎都可以媲美云端运行的比它 要大得多的模型,而且它还拥有「看、听、想」等多模态能力。 重要的是,它并非基于 Transformer,而是基于 国内 AI 创企 RockAI 提出的非 Transformer 架构 Yan 2.0 Preview 。这个架构极大地降低了模型推理时的计算复杂 度,因此可以在算力非常有限的设备上离线运行,比如树莓派。 而且,和其他在设备端运行的「云端大模型的小参数版本」不同,这个模型拥有一定的 原生记忆能力 ,能够在执行推理任务的同时 把记忆融入自己的参数 。 也就是说,在和其他大模型对话时,你每次打开一个新的窗口,模型都不记得你们之前聊过什么,就像一个每天睡一觉就会把你忘了的朋友,每天都见但每天都 是「初见」。相比之下, 基于 Yan 架构的模型会随着时间推移越来越了解你 ,并基于这些信息去回答你的每一个问题。这是当前大多数基于 Transformer 的云端 大模型都做不到的,更不用提被剪枝、蒸馏等手段破坏了再学习能力的「小模型」 ...
芯片,最新路线图
半导体行业观察· 2025-06-25 09:56
半导体工艺节点命名演变 - 当前7纳米、5纳米、3纳米芯片命名已脱离物理尺寸本质,演变为约定俗成的技术标识 [8] - 早期平面晶体管时代命名直接反映物理尺寸(如90纳米、65纳米),FinFET架构出现后命名逻辑改变 [8] - 三维晶体管通过垂直堆叠提升性能,性能提升更多源于架构创新而非物理尺寸收缩 [9] - 现代工艺节点命名延续"等效平面晶体管"概念,成为衡量技术代际演进的重要标准 [11] FinFET架构发展历程 - 英特尔2011年首次商业化FinFET技术应用于22nm工艺,显著提升性能并降低功耗 [18] - FinFET将晶体管结构从平面变为立体,增加源极和栅极接触面积,空间利用率大幅提升 [18] - 5nm节点后基于FinFET结构进行尺寸缩小变得困难,量子隧穿效应导致漏电流问题加剧 [19] - FinFET技术自2011年商业化以来成功推动从22nm到5nm/3nm多代工艺发展 [18] NanoSheet架构革新 - NanoSheet采用环绕闸极(GAA)结构,全方位包围导电通道,有效抑制量子隧穿效应 [23] - 相比FinFET,NanoSheet可在相同尺寸下提供更高驱动电流,突破当前工艺困境 [23] - 台积电计划2028年量产采用第二代GAA纳米片晶体管的A14(1.4nm)工艺 [27] - 三星和英特尔已率先转向GAA工艺,FinFET在先进节点上逐步被取代 [27] 光刻技术演进 - 标准EUV(0.33NA)光刻机单台成本达1.5-2亿美元,支撑FinFET架构发展 [30] - High NA EUV(0.55NA)将取代标准EUV,直接实现2nm以下节点单曝光成型 [32] - Hyper NA EUV(0.75NA)目标2035年实现0.3nm制程,面临米级反射镜制造等挑战 [49] - 0.55NA High NA EUV预计可支持到2033年A5节点,更先进节点需0.75NA技术 [50] 背面供电技术 - 从N2节点开始引入背面供电技术,将电源传输路径转移至芯片背面 [34] - 该技术可降低30%功耗同时提升20%运算速度,特别适合AI芯片等高性能场景 [37] - 背面供电需要结合High NA EUV光刻技术,将供电互连间距缩小至50纳米以下 [36] 未来架构发展路线 - 叉片晶体管(ForkSheet)被视为纳米片延伸,金属间距可缩小至18纳米 [43] - CFET架构通过n-FET和p-FET垂直堆叠实现密度翻倍,预计2031年A7节点引入 [45] - 2DFET采用单原子层2D材料,预计2037年A2节点取代CFET,制造流程可简化30% [56] - 二硫化钨等过渡金属化合物展现潜力,石墨烯因零带隙特性不适用晶体管 [58]