摩尔定律
搜索文档
一位资深CPU架构师的观察
36氪· 2026-01-05 13:23
行业核心挑战与范式转变 - 半导体行业正面临深刻变革,传统通过工艺尺寸缩小提升性能的方式日益受到功耗密度和散热限制的挑战[2] - 人工智能工作负载的爆炸式增长使计算需求呈数量级增加,进一步加剧了数据中心和边缘设备的功耗与散热压力[2] - 微架构创新不再是次要优化,必须与工艺技术同步发展,电源供应、散热管理和计算效率需在设备和系统层面整体考量[2] - 下一代计算不仅需要更小的晶体管,还需要更智能的系统,架构与工艺的协同设计是延伸摩尔定律轨迹的关键[27] 热密度与散热管理挑战 - 更高的集成度与更小的特征尺寸放大了热密度(单位面积功率),局部发热问题加剧[3] - 硅芯片从安全温度升至临界温度的速度极快,热传感器和散热措施必须从一开始就纳入设计[7] - 散热片和风扇等传统散热策略已不再适用,液冷、均热板等方案存在成本、可靠性和尺寸局限[8] - 散热挑战已从高性能系统蔓延至主流设备和移动设备[7] 支持散热的架构策略 - 微架构和芯片布局已成为散热管理的首要工具[8] - 架构师采用多种技术分散和避免热热点,包括:热感知布局规划、通过复制关键发热逻辑并轮换活动以实现局部冷却、嵌入温度传感器以动态调整工作负载和电压/频率设置、利用面积空间分散功率以降低峰值温度[10] 性能与功耗的权衡关系 - CPU性能与功耗遵循特定关系:性能 = IPC * 频率;功耗 = 漏电功耗 + C * V² * 频率,其中C为平均动态电容,V为电压[9] - 在电压缩放区域,性能随电压增加而提高,但功耗呈指数级增长,凸显了降低漏电和减少电容的工艺技术的必要性[11] - 工艺技术进步使得在恒定功耗下实现更高性能(如通过更快的晶体管、降低电容)以及在恒定性能下实现更低功耗(如通过低漏电材料和堆叠器件)成为可能[13] 微架构设计对性能与功耗的影响 - 添加微架构性能特性(如更大的结构或更多的层压结构)可实现更高性能,但通常会增加电容[15] - 通过简化微架构(更小的结构尺寸、更少的推测)可以减小面积,从而降低目标频率,进而降低电容和漏电功耗[17] - 结合高性能和低功耗的CPU内核是实现所需性能和整体系统功耗优化的有效方法[17] 系统级扩展的限制 - 阿姆达尔定律限制了多处理器性能的可扩展性,并行程序的性能会渐近地接近一个由程序串行部分决定的极限[18] - 硬件和软件共享资源(如锁、缓存、内存、网络)导致多处理器可扩展性受限,对于整数工作负载其值很少超过0.97,对于浮点工作负载很少超过0.90[20] - 在实际工作负载测量中,最常见的情况是只有一个核心处于活动状态,其次是所有核心都处于活动状态[23] - 功耗和带宽由动态变化的活动核心数共享,这影响了应用于每种类型核心的数量、类型和微架构优化[25] 关键的工艺研究方向与架构需求 - 工艺研究人员必须认识到,能够提高导热性和支持非均匀电压域的材料和布局创新是下一代架构的关键推动因素[13] - 工艺和架构团队需要紧密协作,架构热图必须指导器件布局和封装,工艺限制必须指导架构布局规划和性能目标[26] - 关键的工艺研究领域包括:低漏电、低电容材料以支持频率扩展同时避免功耗失控;热感知3D集成以管理堆叠芯片中的垂直热流;精细化电源门控以实现每个模块的功耗控制;片上热传感器以实现实时架构热管理;异构集成以支持在同一芯片上实现高性能和高效率核心[28]
消费电子ETF(561600)涨超2.3%,2025年全球半导体市场创历史新高
新浪财经· 2026-01-05 10:22
市场表现 - 截至2026年1月5日09:50,中证消费电子主题指数(931494)强势上涨2.51% [1] - 指数成分股信维通信上涨7.58%,兆易创新上涨7.30%,蓝思科技上涨6.61%,北京君正、恒玄科技等个股跟涨 [1] - 消费电子ETF(561600)上涨2.32%,最新价报1.23元 [1] - 消费电子ETF近3天获得连续资金净流入,合计净流入2912.87万元,日均净流入达970.96万元,最高单日净流入2181.52万元 [1] 行业基本面与前景 - 2025年全球半导体市场创历史新高,预计2026年将继续增长9%至7607亿美元 [1] - 在AI驱动下,HBM和高端存储需求推动存储超级周期 [1] - 3D NAND堆叠与DRAM技术迭代使刻蚀、薄膜沉积设备使用量和价值量倍增 [1] - 先进封装成为延续摩尔定律的重要路径,AI芯片对CoWoS、HBM的需求爆发催生全链条设备投资机会 [1] - 国产化率提升叠加晶圆厂扩产意愿增强,半导体设备行业将迎来高景气周期 [2] 指数与产品构成 - 消费电子ETF紧密跟踪中证消费电子主题指数 [2] - 中证消费电子主题指数选取50只业务涉及元器件生产、整机品牌设计及生产等消费电子相关的上市公司证券作为指数样本 [2] - 截至2025年12月31日,指数前十大权重股分别为立讯精密、寒武纪、工业富联、中芯国际、京东方A、兆易创新、澜起科技、东山精密、豪威集团、生益科技,前十大权重股合计占比54.35% [2] - 消费电子ETF(561600)设有场外联接基金,包括平安中证消费电子主题ETF发起式联接A(015894)、C(015895)、E(024557) [2]
一位资深CPU架构师的观察
半导体行业观察· 2026-01-05 09:49
文章核心观点 - 半导体行业正面临功耗和散热限制带来的根本性挑战,传统的工艺尺寸缩放优势减弱,微架构创新与工艺技术必须进行协同设计,以实现系统级效率并满足人工智能等爆炸式增长的计算需求 [1][3][34] 热密度挑战与架构应对 - 更高的集成度导致热密度急剧上升,单位面积功率增加,芯片从安全温度升至临界温度的速度极快,散热挑战已从高性能系统蔓延至主流和移动设备 [5][7][9] - 传统散热方案如散热片和风扇已不再适用,液冷等方案存在成本与尺寸局限,微架构和芯片布局成为散热管理的首要工具 [10] - 微架构师采用多种热管理策略:热感知布局规划以扩散热量、通过复制关键发热逻辑并轮换活动以实现局部冷却、嵌入温度传感器以动态调整工作负载和电压/频率设置、利用面积空间分散功率以降低峰值温度 [11] 高效节能性能 - 在CPU设计中,性能随电压增加而提高,但功耗呈指数级增长,凸显了降低漏电和减少电容的工艺技术的必要性 [13] - 工艺技术进步可在恒定功耗下实现更高性能,或在恒定性能下降低功耗,但激进的尺寸缩小可能加剧热密度,需要架构应对 [16] - 微架构特性如增大结构尺寸可提高性能但增加电容,而简化微架构可减小面积、降低目标频率,从而降低电容和漏电,结合高性能与低功耗内核是优化系统功耗的有效方法 [18][20] 系统级扩展限制 - 阿姆达尔定律限制了多处理器性能的可扩展性,并行程序的性能渐近地接近由程序串行部分决定的极限 [23] - 硬件和软件共享资源导致多处理器可扩展性受限,对于整数工作负载,可扩展性很少超过0.97,对于浮点工作负载很少超过0.90 [25][26] - 典型工作负载条件下,最常见的情况是只有一个核心处于活动状态,其次才是所有核心都活动,活动核心数动态变化影响功耗和带宽共享,进而影响核心数量、类型和微架构优化的设计 [27][28] 工艺与架构协同设计方向 - 关键工艺研究方向需与架构需求契合:低漏电、低电容材料以支持频率扩展、热感知3D集成以管理堆叠芯片中的垂直热流、精细化电源门控以实现每个模块的功耗控制 [31] - 工艺和架构团队需紧密协作,架构热图必须指导器件布局和封装,工艺限制必须指导架构布局规划和性能目标,通过协同优化实现更明智的权衡 [32] - 下一代计算需要更智能的系统,通过将能效和散热约束视为共同责任,以延伸摩尔定律至可持续的高性能未来 [34]
用第一性原理解锁长期投资:柏基战胜纳斯达克的秘诀 | 螺丝钉带你读书
银行螺丝钉· 2026-01-03 22:08
文章核心观点 - 文章通过介绍柏基投资公司的成长风格投资方法,阐述了“第一性原理”在投资分析中的核心作用,并强调了长期耐心持有对于投资成功的重要性 [3][4][5][61] 柏基的投资理念与方法 - 柏基的成长风格投资立足于对未来趋势的判断 [4] - 其投资方法论离不开“第一性原理”,即寻找一个系统中最基本的命题和原理 [5][7] - 柏基通过参与学术界协会、俱乐部,与各行业有思想深度的人士交流,以碰撞灵感、更早发现行业趋势 [33][36][37] - 通过与学术界合作研讨,分析前沿技术的底层第一性原理 [39] - 认识到即便找到趋势和原理,也难以精准预测最终胜出的公司,因此选择投资该领域最有可能胜出的几家公司以降低风险 [40][41][47] 第一性原理的例证与应用 - 以指数基金为例,其第一性原理是低成本,而非市场有效性 [12][22] - 指数基金之父约翰·博格的逻辑指出:所有股东的总收益等于全市场指数收益,但扣除费用后,低成本的指数基金长期回报会超过非指数基金投资者 [14][15][16][20][21] - 过去十多年,A股指数基金从总规模几千亿、活跃投资者仅百万级别,发展至成为市场主力 [10][23][24] - 个人电脑产业快速发展的第一性原理是摩尔定律(处理器性能约每两年翻一倍,价格降一半) [28] - 即时通讯软件(如微信)快速发展的第一性原理是梅特卡夫定律(网络价值与用户数的平方成正比) [31] 长期投资与耐心的重要性 - 柏基认为需要用10年以上的时间去评估一项投资 [51] - 柏基以10年为单位进行业绩评价,而非季度或年度 [52] - 柏基平均持有一家企业的年限是5-10年,远高于美股平均持有期(不到1年)和A股平均持有期(约几周) [53][54][55] - 全球顶级投资大师和机构(如巴菲特、主权基金、养老金)的成功共同特点是耐心,能够以十几年甚至几十年的维度规划长期投资 [56][58][59][60]
6年间单片晶圆毛利润暴涨3.3倍,台积电杀疯了
搜狐财经· 2025-12-30 10:39
台积电定价策略的历史演变 - 2005年至2019年的十五年间,公司定价策略极为保守,晶圆平均售价在15年里仅上涨了32美元,年均增长率仅为0.1% [2] - 此阶段受限于智能手机市场对成本的敏感度以及激烈的行业竞争 [2] 2019年后的定价权与商业模式重塑 - 2019年成为分水岭,公司全面拥抱EUV技术,晶圆平均售价以每年15.9%的复合增长率攀升,六年间累计涨幅达133% [3] - 单片晶圆的毛利润在2025年达到了2019年水平的3.3倍 [3] - 公司利用其不可替代的市场地位和广泛的生态合作伙伴网络,掌握了极高的定价权,并将上涨的成本成功转嫁至下游 [3] 成本转嫁与盈利能力提升 - 2019年之前,每增加1美元的生产成本,晶圆售价仅增加1.43美元,获得0.43美元的增量利润 [3] - 2019年之后,每增加1美元的生产成本,能推动售价上涨2.31美元,增量利润飙升至1.30美元以上 [3] - 这种“高投入、更高回报”的模式得益于英伟达、AMD和苹果等客户对AI及高性能计算芯片的刚性需求,这些客户更看重性能而非价格 [3] 技术壁垒与市场地位 - 摩尔定律放缓及EUV光刻机的高昂成本(单台约2.35亿美元)提高了行业门槛,为公司重塑商业模式提供了机会 [2] - 不同于三星因良率问题仅能自用EUV产能,公司通过OIP深度绑定了全球顶级芯片设计商 [4] - 随着先进封装技术的引入,技术锁定进一步加深 [4] - 目前,无论是英特尔代工还是三星代工,都无法在先进制程的产能和良率上对公司构成实质威胁 [4] 行业竞争格局展望 - 在真正的挑战者出现之前,公司这种由“系统性供应不足”和“高资本密集度”支撑的卖方市场格局将难以撼动 [5]
摩尔定律失效?手机居然越卖越贵 背后是AI产能争夺战
21世纪经济报道· 2025-12-29 21:30
消费电子终端产品涨价现象 - 2025年底出现“手机涨价潮”,小米17 Ultra起售价6999元,较上代涨500元,OPPO、vivo等主流厂商旗舰新机价格也有不同程度上调 [1][3] - 涨价被认为会持续很长时间,业内人士预计至少以年记,甚至一年半到两年 [2] 内存供需失衡与成本上涨 - 内存成本上涨是手机涨价主因,高性能计算和数据中心需求猛增及扩产滞后,导致内存供给出现巨大缺口,成本具有暴涨性和长周期性 [3] - LPDDR4X在原厂产线切换后,整体供应出现约15%-20%的缺口,6GB及以下低容量产品供应十分紧张 [4] - 主要原厂维持审慎的产能扩张策略,受产能建设周期滞后影响,预计对2026年位元产出的增量贡献有限 [4] 技术迭代与供应结构变化 - 全球智能手机LPDDR5X渗透率已超50%,LPDDR4X供给紧缩推升价格,将推动手机产业加速导入LPDDR5X [4] - 随着原厂逐步停产,到2026年,LPDDR4在总LPDDR供应中占比将降至26%,LPDDR5供应占比快速提升至73% [4] - 由于手机需求叠加AI需求,LPDDR5供给也会持续紧张,预计明年都会面临供应紧缺和涨价问题 [4] AI服务器需求挤占传统产能 - AI服务器需求正挤占原本属于手机、电脑的内存供应 [5] - OpenAI与三星及SK海力士签署意向书,三星预估OpenAI内存需求高达每月90万片DRAM晶圆,SK海力士称此需求是目前HBM行业产能的两倍多 [5] - 2025年底,苹果、微软、谷歌、Meta等全球科技大厂纷纷赴韩与存储芯片厂商洽谈产能争取 [6] - 头部云服务商巨额采购订单加剧原厂将有限产能向服务器存储倾斜,导致非服务器市场面临供应紧缺 [7] 服务器内存技术路线变革 - 英伟达在AI服务器中引入LPDDR5X模组,进一步挤占高端产能,其GB300超级芯片将全面采用SOCAMM LPDDR5X内存 [7] - 英伟达选择LPDDR5X基于能效优势(功耗仅为传统RDIMM的1/3,可降低AI服务器30%-40%的内存功耗占比)、高密度集成和性价比考量 [7] - 传统DDR5内存每通道功耗约为LPDDR5X的1.8倍,大规模部署下电费成本差异巨大 [8] - 美光已宣布量产SOCAMM,三星已开发出专为AI数据中心的“SOCAMM2”并开始提供样品 [8] - 预计未来AI服务器中的LPDDR需求将持续增长,与HBM形成异构存储互补生态 [8] 国产存储厂商的发展机遇 - 上游原厂产线转向高毛利的AI存储,为国产DRAM厂商留出历史性机遇,存储器指数(8841241.WI)今年以来已涨超70% [9][10] - 预计2026年标准DDR5/RDDR5供给缺口将达15%-20%,填补空白成为国产厂商核心机会 [10] - 国产厂商在标准DRAM(技术门槛低于HBM)、成本结构(无需承担HBM巨额研发成本)和供应链安全方面具有优势 [10] - 在DDR4等传统市场,国产厂商迎来机会,例如兆易创新DRAM产品中DDR4收入占比今年超过一半 [10] - 在LPDDR5X等前沿市场,长鑫存储已展示最新产品,最高速率达10667Mbps,最高颗粒容量16Gb,关键性能指标位居国际顶流梯队 [10][11] - 海外原厂转向高端市场导致中低端DRAM出现供给缺口,为国产替代提供了错位竞争机会 [11]
绕开光刻机“卡脖子”,中国新型芯片问世!专访北大孙仲:支撑AI训练和具身智能,可在28纳米及以上成熟工艺量产
每日经济新闻· 2025-12-29 18:20
技术突破与核心优势 - 北京大学团队成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片,在全球范围内首次将模拟计算的精度提升至24位定点精度[2] - 该芯片将模拟计算的相对误差从1%大幅降低至千万分之一(10⁻⁷),精度提升了5个数量级,首次使模拟计算具备与主流数字计算(如FP32)接轨的数值可靠性[8][13] - 核心创新点包括:器件层面采用可量产的阻变存储器实现“现代模拟计算”范式;电路层面设计全新反馈电路实现快速近似求解;算法层面结合“位切片”与迭代优化算法高效实现高精度矩阵方程求解[15] - 相较于数字计算,模拟计算通过物理定律直接进行运算,无需二进制编码和逻辑门操作,因此在硬件资源开销与能耗上均下降数个量级,能效提升百倍,算力吞吐量提升千倍[6][10] - 该芯片可在28纳米及以上成熟制程量产,能够利用现有芯片生产线,有效绕开先进光刻机等“卡脖子”环节[2][10] 应用场景与市场定位 - 该芯片面向矩阵计算,是AI推理(矩阵乘法)、AI二阶训练(矩阵方程求解)、6G通信、具身智能及科学计算等前沿领域的核心运算单元[2][10] - 该技术特别适用于AI模型的二阶训练加速,因为二阶训练每次迭代都需解矩阵方程,计算量巨大,而该芯片擅长快速矩阵方程求解[19] - 除AI与6G外,超级计算(如气象预报、量子力学模拟)是更庞大且契合的应用场景,因为超算中心的大量算力实质上都用于求解矩阵方程[21] - 目前芯片处于实验室原理验证阶段,矩阵规模为16x16,更适用于中等规模场景,在小规模任务上性能优势不明显,尚未进行大规模应用[11][18] - 团队计划在2年内将芯片阵列规模从16x16提升至128x128,并力争达到512x512,以在具身智能、6G通信等中等规模场景产生实际效用[11][25] 行业影响与战略意义 - 该技术为算力领域提供了一条全新的“模拟计算”技术路线,有助于减少对单一数字计算范式(如GPU)的依赖[4] - 随着摩尔定律趋于终结,晶体管微缩困难,数字计算陷入能耗困局,横向堆叠计算卡(从百卡到十万卡)的方式在能耗和碳排放上不可持续,模拟计算被视为一种潜在的突破路径[5] - 该成果由中国团队在全球范围内首次实现,在模拟计算赛道上处于领先位置,为中国在算力领域提供了“换道超车”的可能性,有望降低对先进制程和英伟达GPU的单一依赖[11] - 新型芯片的问世证实了新路径的可行性,但距离真正大规模应用和“摆脱依赖”仍有很长的路,需要国家、科技界和产业界持续投入进行技术储备,以抓住未来算力需求爆发的窗口期[11][26]
98年的他,想用iPhone的价格做高性能服务器
虎嗅APP· 2025-12-27 18:30
公司概况与创始人背景 - 公司名为寅谱,是一家设计并生产计算机控制系统的科技公司,产品包括主板智控和即将发布的SSD智控等 [7] - 创始人田洋为98年生人,拥有清华本科背景及哲学学位,长期从事统计物理研究,具有学术与文学相结合的感性思维 [5] - 公司于2024年10月成立,2024年12月获得第一笔个人投资,2025年后融资逐渐顺利,即将完成第三轮机构融资 [25][37] 核心技术与产品定位 - 上游业务是设计制造计算机的控制系统或控制芯片,其角色类似于计算机的“COO”,旨在不改变处理器硬件和软件兼容性的前提下,提升整体运算性能或降低功耗 [18][19] - 下游业务是设计计算机主板或整机,与具备生产能力的股东合作,形成“设计+生产”模式 [19] - 核心技术是主板智控系统,通过实时扫描芯片物理体质与系统负载,自动化生成个性化控制策略,以解决芯片“体质公差”问题,将每台机器的硬件性能调至体质允许的最强状态 [30][34][35] - 该技术可使硬件处理器性能提升半代以上,通用性能提升约10%,或功耗降低约12% [36] - 另一项技术是SSD控制芯片,主要用于提高大模型在内存和显存受限情况下的推理速度,适合消费端电子产品 [35] 市场战略与目标客群 - 将计算机市场比喻为哑铃型,两端分别是个人计算机市场和服务器集群市场,中间细长地带几乎没有成型产品 [7][20] - 公司瞄准哑铃中间市场,目标客群是消费能力比普通C端强但买不起昂贵服务器、又需要接近入门级服务器算力的用户,如因工作需求或个人爱好的中小B端及高端个人消费者 [7][9][21] - 产品定位是“以iPhone的价格,提供10万元级别的入门级服务器性能”,实现错位竞争 [6][9][21] - 产品形态为小型高性能计算机,可放在桌上或单手捧起,兼具C端和B端属性 [22] 商业逻辑与竞争壁垒 - 市场需求源于技术发展:芯片制程越先进,“体质公差”越大,当性能差异拉到约10%时便产生了商业化解决的契机 [31][32] - 竞争壁垒高:1) 技术冷门且与工业生产结合紧密,创业公司难以介入;2) 自动化系统相比传统主板厂商的手工调试有实时性和个性化优势;3) 需要与AMD、英特尔、英伟达等芯片厂商建立深度合作并获得控制许可,形成了强准入壁垒 [32][33][36] - 具备先驱者优势:上游客户(全球计算机厂商)高度集中,一旦率先切入并建立合作,后来者很难获得生存空间 [35] - 公司通过早期引入具备产业资源和生产能力的投资方,打通了制造环节 [15] 发展历程与战略调整 - 创业起点源于创始人兴趣,最初方向是为集群做算力中心优化方案,但在客户调研后发现该需求不稳定,于2024年12月迅速转型至当前业务 [10][27] - 发现算力中心优化需求对市场周期依赖性强,在大部分时间内,算力中心的核心痛点是缺乏客户导致闲置率高,而非运行效率低 [11][28] - 产品线经历重大调整:最初在X86/ARM计算线和RISC-V电子线各投入50%资源,后调整为将95%资源聚焦于计算线,仅留5%给RISC-V用于技术验证,因RISC-V生态标准分散,对初创团队适配开发造成很大困难 [15][52][53] - 商业化验证始于2025年4月,于2025年7月正式启动商业化 [40] 运营理念与学习曲线 - 坚持从客户真实需求出发,通过直接见面、被拒绝来厘清产品核心价值点,而非假设需求 [11][12][29][51] - 创始人强调学习心态,认为公司前三年定位为“学习型公司”,承认在半导体行业经验不足,通过向客户和行业学习来快速缩小差距 [44] - 在商业合作上学会“做减法”,秉持“让别人赚到他该赚的钱”的原则,不试图包揽所有环节,只专注自身核心价值部分 [15][60] - 商业嗅觉是通过在市场实践中不断“被毒打”和复盘锻炼出来的 [46][47] - 对于行业预测保持务实,基于掌握的上下游信息,专注于精准预判未来一年的趋势并快速落地产品,而非预测遥远未来 [45] 产品规划与未来挑战 - 第一代桌面超算产品“Hilbert”预计2026年登陆北美市场 [6] - 上游SSD控制芯片计划于2026年年初落地生产并商业化,2026年5月至6月推出成型产品面向市场销售 [57] - 下游终端业务:国内To B已在销售;计划2026年2月上线海外To C业务作为品牌预热;重点第二代产品计划于2026年夏天在国内外同步上线 [57] - 未来产品泛化方向包括车载领域,并已涉及为AI陪伴硬件等公司提供搭载其智控技术的小型PCBA平台 [58][59] - 近期主要挑战是同时推进上游SSD芯片商业化、下游终端国内外销售以及第二代产品研发上市所带来的巨大设计和生产压力 [57]
场效应管:100周年
半导体行业观察· 2025-12-26 09:57
场效应晶体管(FET)的百年发展历程 - 文章核心观点:场效应晶体管(FET)的概念于1925年由尤利乌斯·埃德加·利连菲尔德发明,但其从原理提出到最终实现并走向实用化,经历了长达约35年的曲折历程,期间半导体物理、材料纯度和关键结构(如PN结、肖特基结)的发现与技术进步起到了决定性作用 [1][4][11][32] FET的早期概念与发明 - 1925年,德国物理学家尤利乌斯·埃德加·利连菲尔德发明了金属半导体场效应晶体管(MES FET),其结构以铝箔为栅极,硫化铜(Cu₂S)为源极、漏极和沟道 [5][7] - 1928年,利连菲尔德进一步发明了金属氧化物半导体场效应晶体管(MOS FET),使用氧化铝薄膜(Al₂O₃)作为栅极绝缘膜 [8] 实现FET面临的核心挑战 - 早期半导体材料纯度极低,缺陷和杂质多,导致无法精确测量和控制材料特性 [11] - 半导体内部存在大量电荷,难以像真空管那样通过栅极电压有效控制电流,需要在半导体内部创建类似“真空”的极低电荷区域 [11] - 半导体表面存在的表面态电荷会屏蔽栅极电场,阻碍其对半导体内部电荷的控制,这一问题在1946年被约翰·巴丁指出 [22] 关键技术与结构的突破 - 1939/1940年,贝尔电话实验室的罗素·舒梅克·奥尔发现了PN结,其交界处形成的“耗尽层”是一个无电荷区域,为控制电流提供了关键结构 [18] - 1938年,德国西门子公司的沃尔特·肖特基提出了肖特基结理论,解释了金属-半导体接触面的整流原理,其接触面半导体侧也会形成极薄的无电荷区域(耗尽层) [19][20] - 1958年,贝尔电话实验室的马丁·阿塔拉开发了硅表面热氧化生成二氧化硅(SiO₂)薄膜的技术,该薄膜可作为MOS FET的栅极绝缘层,稳定硅表面 [27] 从双极晶体管到实用FET的演进 - 1947年12月,贝尔电话实验室的约翰·巴丁和沃尔特·H·布拉顿制造出世界上第一个实用的“点接触型”晶体管(结型晶体管) [13] - 1948年1月,威廉·肖克利提出了双极结型晶体管(BJT) [15] - 20世纪50年代,硅单晶生长、杂质掺杂、光刻等双极晶体管技术的发展,为后续MOS FET的实现奠定了基础 [21] - 1953年,威廉·肖克利与沃尔特·L·布朗制造出结型场效应晶体管(JFET)原型 [24] - 1959年,贝尔电话实验室的Dawon Kahng和Martin Atala发明了MOS场效应晶体管,并于1960年在学术会议上展示 [29][30] 发展阶段的划分 - 岩井博教授将FET的百年(1925-2025)划分为两个时期:前45年(1925-1970)为“循序渐进的时期”,是在未知道路上的探索;后55年(1970-2025)为“成功故事的时期”,以“规模定律”和“摩尔定律”为标志 [4]
国产万卡超集群亮相:中国人工智能,迈入新阶段
半导体芯闻· 2025-12-25 18:20
文章核心观点 - 文章报道了首届光合组织人工智能创新大会(HAIC2025)的盛况,并重点阐述了中国AI计算产业在摩尔定律放缓的背景下,通过发展系统级工程、开放合作与生态共建来应对大模型算力挑战,以海光信息和中科曙光为代表的企业展示了其在芯片、超集群系统及开放架构方面的创新与实践,标志着中国AI产业正迈向一个新时代 [2][4][13][14] 行业背景与挑战 - 摩尔定律在工艺演进至7nm后逐渐失效,单芯片性能迭代已无法满足爆炸式增长的大模型算力需求,行业必须转向系统级解决方案 [4] - 大模型发展对计算装备提出了前所未有的新要求,挑战主要集中在内存容量与带宽、各类互联(线间、节点间)的带宽与延迟、系统能耗与能效、稳定性以及应用生态兼容性等方面 [2] 企业战略与解决方案 海光信息的“双芯战略” - 海光信息推出“双芯战略”,核心举措包括围绕HSL总线互联协议和共建AI软件栈体系,旨在为行业智能化提供“源”动力 [5] - 该战略的优势在于国内AI产品种类比国际更丰富,生态连接更深入,能够针对主流应用实现定制化、应用化、深入化和适配化,这是其“C86+GPGPU”技术路线的独特优势 [6] - 海光致力于每年迭代一代芯片以实现性能翻番,缩短与国际巨头的差距,并通过开源开放协同光合组织超6000家合作伙伴共建“人工智能+”产业生态系统 [5] - 未来将更大力度开放系统总线互联协议(HSL),并携手国产AI芯片厂商共建高效开放的软件栈生态标准,逐步打造“中国版CUDA” [13] 中科曙光的超集群系统 - 中科曙光发布了全球首个单机柜实现640卡全互联的超节点——曙光scalex640,其创新点包括:采用浸没式液体相变冷却技术实现全年自然冷却与超低PUE(低至1.04)、高压直流供电技术优化电源效率、超高速硬件架构设计实现单机柜640卡全电互联 [8] - 在scalex640基础上,中科曙光展出了全球领先的大规模智能计算系统——scaleX万卡超集群,这是国产万卡级AI集群系统首次以真机形式亮相 [9] - scaleX万卡超集群由16个scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops,将单机柜算力密度提升20倍 [11] - scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片自主研发,实现400Gb/s超高带宽、低于1微秒端侧通信延迟,相比传统IB网络性能提升2.33倍,同时网络总体成本降低30%,并可轻松将集群规模扩展至10万卡以上 [11] - 该系统通过“超级隧道”、AI数据加速等设计实现存、算、传紧耦合深度优化,可将AI加速卡资源利用率提高55%,并通过物理集群数字孪生实现智能运维,支撑集群长期可用性达99.99% [12] - 中科曙光强调打造AI开放架构的决心,希望开放公司在各技术链条的积累,让产业链合作伙伴能专注自身擅长领域,协力推动生态发展 [12] - 为打造更具竞争力的集群,中科曙光在多个层面进行研发投入,例如自研中国最好的112G SerDes,为Scale Fabric网络提供了应对复杂环境可靠性风险的底气 [13] 技术趋势与生态发展 - 大模型对算力的需求依然火爆,同时MOE已成为主流模型架构,对通讯效率和性能要求持续提升,KV Cache等技术正推动CPU与AI芯片融合,共同构建异构算力的超级大脑 [4][5] - 行业需要从单点突破转向系统工程,并通过合作开放促进跨层软硬件协同与产业链合作共赢 [2] - “十五五”规划将人工智能提升至战略高度,顺应国家发展与产业升级需求 [5] - 中国人工智能生态链从业者正通过AI开放架构的支持,推动本土AI芯片、基础设施、大模型及应用在国际上大放异彩 [14]