Workflow
指令集架构
icon
搜索文档
中国算力芯片的“新十年”
腾讯研究院· 2025-10-31 16:03
处理器芯片发展历程与趋势 - 过去40年处理器芯片发展呈现螺旋式路径:自研-放弃自研-重新自研 [6] - 近5年整机和平台厂商重新加入芯片战争,趋势从以CPU为中心的同构计算转向CPU联合xPU的异构计算 [6] - "十五五"规划建议稿强调加快科技自立自强,聚焦半导体等关键技术环节 [7] 指令集架构的市场格局与演进 - 当前CPU领域由两种指令集主导:PC和服务器领域的x86架构与智能手机领域的ARM架构 [11] - x86架构特点为指令复杂、性能高但功耗大,主导厂商为英特尔和AMD [12] - ARM架构特点为指令简单、功耗效率高,主要应用于移动设备 [12] - RISC-V架构为开源模式,可定制但存在碎片化问题,核心厂商包括SiFive、Andes、阿里平头哥等 [12] - 历史上许多创新架构如i860/i960、68000、PowerPC等逐渐凋零,x86胜出靠的是向高端RISC学习并不断扩展指令子集,以及PC与服务器芯片出货量大的规模效应 [13] - 架构创新的根本挑战在于经济规律,软件生态的统治力难以颠覆,例如英特尔和惠普联合开发的IA-64安腾处理器耗资巨大最终未能成功 [13][19] 计算体系结构的发展与挑战 - 摩尔定律逐渐失效后,业界依赖增加晶体管数量并行提升性能,如增加数据位宽、功能部件和处理器核数量 [16] - 计算机体系结构分为激进结构(完全动态优化)、保守结构(静态优化)和折中结构(动静态结合优化) [17] - 高端CPU常采用激进结构但复杂且易受硬件漏洞攻击,业界更倾向于通过增加处理器核数量的众核结构来提升性能 [18] - 众核xPU芯片(如英特尔Xeon Phi、Google TPU、GPGPU)大规模应用需解决生态系统问题,英伟达CUDA拥有成熟的并行软件生态是其优势 [18][19] - 2009至2018年,x86软件开发费用持续上升,2018年全球投入高达600亿美元,而同期全球服务器硬件总收入为800亿美元,软件投入远超硬件 [20][21] ARM架构的机遇与RISC-V的挑战 - ARM服务器打破x86垄断的机遇在于:掌控全栈技术的大厂(如苹果、亚马逊)放弃x86进行生态迁移,以及端云融合使ARM终端优势蔓延至云端 [24] - RISC-V目前商业化成功领域集中于软件简单的嵌入式场景,如微控制器和存储类产品 [26] - RISC-V硬件生态不成熟,缺乏有竞争力的高性价比处理器核和支持多核互连的高性能片上网络,且ARM不单独授权片上网络IP [26] - 尽管跨平台语言和虚拟机技术发展,但硬件指令的直接支持对性能、能效比至关重要,英特尔持续扩展指令集(如SGX、AVX512、AI扩展指令集) [27] - 业界软件主要针对英特尔CPU优化,即使同为x86的AMD CPU支持软件配置种类也较少,阿里公有云平台仅使用英特尔CPU产品 [27] - RISC-V进入通用计算平台仍有漫长路程 [28] 自研芯片的模式与成功关键 - 云厂商自研芯片模式可行,因其盈利基础在于增值服务而非硬件,且掌控全栈软硬件使生态移植困难较小,自身规模大可负担研发费用 [30] - 苹果公司实现核心产品线处理器全线自研(手机A系列、平板/PC的M系列、手表W系列、耳机H系列),是成功案例 [31] - 苹果自研成功关键在于配合自研系统软件优化用户体验,并通过营销形成高端形象,而非仅聚焦纸面参数 [32] - 软件生态投入大于硬件研发,软件掉队会导致硬件利用率不高,如部分国产智算中心投资规模大但实际利用率低 [33] 中国算力芯片的发展路径 - 未来五年十年国产算力芯片的突破口在于指令系统结构的统一 [7] - 建议将RISC-V作为统一指令系统,所有CPU/GPU/xPU基于RISC-V及其扩展开发,以推动架构创新、扩大规模效应并高效利用研发资源 [7][36] - 体系结构创新可在现有指令系统框架内实现,例如Tenstorrent基于RISC-V扩展AI子指令集开发AI加速方案,或扩展密码学子指令集支持后量子密码 [35] - 统一指令集可避免重复劳动和研发资源浪费,是应对软件生态高投入挑战的关键路径 [36]
象帝先董事长回顾与展望中国算力芯片的“新十年”
是说芯语· 2025-10-30 11:34
核心观点 - 处理器芯片发展呈现“自研-放弃自研-自研”的螺旋式道路,近5年整机和平台厂商重新加入自研芯片战争,趋势是从以CPU为中心的同构计算转向CPU联合xPU的异构计算 [4][5] - 未来五年至十年,国产算力芯片的突破口在于指令系统结构的统一,建议将RISC-V作为统一指令系统,所有CPU/GPU/xPU基于RISC-V及其扩展开发,以扩大规模效应并高效利用研发资源 [5] - 架构创新难敌经济规律,指令集架构从几十款快速收敛至少数几款,x86和ARM占据主导地位是市场洗牌的结果,其成功关键在于庞大的软硬件生态系统和规模经济效应 [10][11][13] 计算模式与指令集架构演变 - 计算机经历八十多年历史,计算模式从早期集中式处理演变为分布式,再进化为集中式云中心和泛在分布智能终端构成的复杂体系 [9] - 当前核心CPU以两种主导指令集为代表:PC和服务器领域是x86架构,智能手机领域是ARM架构 [9] - x86战胜RISC架构靠的是不断向高端RISC学习并根据新应用需求增加指令子集,PC与服务器CPU同为x86架构使芯片出货量大,分摊了服务器CPU研发成本 [11] - RISC CPU失意表面原因是巨额软硬件投入成本,根源是无法颠覆已有软硬件生态系统 [11] 架构创新与生态挑战 - 进入纳米工艺后摩尔定律逐渐失效,晶体管开关速度放缓,业界依赖增加晶体管数量提升性能,基本思路是并行计算 [14] - 计算机体系结构分为激进结构、保守结构和折中结构三种类型,高端CPU常采用激进结构但导致硬件复杂、正确性难验证 [14][15] - 众核结构xPU芯片匹配图像处理、神经网络等并行计算特点,但其大规模应用首先要解决生态系统问题 [15][17] - 2009至2018年企业软件市场中,x86软件市场份额持续上升,2018年全球投入x86软件开发费用高达600亿美元,远超同期服务器硬件800亿美元总收入 [19] - 软件开发费用远高于硬件,新处理器架构难以获得配套软件投资,预计未来很长时间服务器市场x86 CPU仍居主导地位 [19][20] RISC-V发展现状与挑战 - RISC-V应用较多且相对成功的场景是软件简单的嵌入式领域,如微控制器和存储类产品,但物联网需求碎片化导致定制芯片失去规模效应 [21] - RISC-V硬件生态不成熟,缺乏有竞争优势的高性价比处理器核种类和支持多核互连的高性能片上网络 [21] - RISC-V进入以计算机为代表的通用平台还有旷日持久的路程,主要障碍在于软件生态不成熟 [24] - 基于RISC-V指令集扩展支持AI子指令集和后量子密码等创新案例显示其技术可行性,如Tenstorrent等企业开发了基于RISC-V的AI加速计算方案 [30] 自研芯片趋势与统一指令集路径 - 系统和平台厂商重新研发计算芯片,云厂商自研芯片模式可行因盈利基础在增值服务而非硬件,且掌控全栈软硬件使生态移植困难较小 [25] - 苹果公司实现核心产品线处理器全线自研,成功关键在于自研系统软件配合形成优化用户体验,而非单纯芯片自研 [26][27] - 软件定义一切包括成败,指令系统越多软件生态投入越大,当前领域专用架构和其他xPU研发领域出现软件掉队现象 [28][29] - 体系结构创新未必需要新架构,可在现有指令系统框架内实现,统一基于RISC-V指令集开发可避免重复劳动和研发资源浪费 [30]