Workflow
ARM架构
icon
搜索文档
象帝先董事长回顾与展望中国算力芯片的“新十年”
是说芯语· 2025-10-30 11:34
核心观点 - 处理器芯片发展呈现“自研-放弃自研-自研”的螺旋式道路,近5年整机和平台厂商重新加入自研芯片战争,趋势是从以CPU为中心的同构计算转向CPU联合xPU的异构计算 [4][5] - 未来五年至十年,国产算力芯片的突破口在于指令系统结构的统一,建议将RISC-V作为统一指令系统,所有CPU/GPU/xPU基于RISC-V及其扩展开发,以扩大规模效应并高效利用研发资源 [5] - 架构创新难敌经济规律,指令集架构从几十款快速收敛至少数几款,x86和ARM占据主导地位是市场洗牌的结果,其成功关键在于庞大的软硬件生态系统和规模经济效应 [10][11][13] 计算模式与指令集架构演变 - 计算机经历八十多年历史,计算模式从早期集中式处理演变为分布式,再进化为集中式云中心和泛在分布智能终端构成的复杂体系 [9] - 当前核心CPU以两种主导指令集为代表:PC和服务器领域是x86架构,智能手机领域是ARM架构 [9] - x86战胜RISC架构靠的是不断向高端RISC学习并根据新应用需求增加指令子集,PC与服务器CPU同为x86架构使芯片出货量大,分摊了服务器CPU研发成本 [11] - RISC CPU失意表面原因是巨额软硬件投入成本,根源是无法颠覆已有软硬件生态系统 [11] 架构创新与生态挑战 - 进入纳米工艺后摩尔定律逐渐失效,晶体管开关速度放缓,业界依赖增加晶体管数量提升性能,基本思路是并行计算 [14] - 计算机体系结构分为激进结构、保守结构和折中结构三种类型,高端CPU常采用激进结构但导致硬件复杂、正确性难验证 [14][15] - 众核结构xPU芯片匹配图像处理、神经网络等并行计算特点,但其大规模应用首先要解决生态系统问题 [15][17] - 2009至2018年企业软件市场中,x86软件市场份额持续上升,2018年全球投入x86软件开发费用高达600亿美元,远超同期服务器硬件800亿美元总收入 [19] - 软件开发费用远高于硬件,新处理器架构难以获得配套软件投资,预计未来很长时间服务器市场x86 CPU仍居主导地位 [19][20] RISC-V发展现状与挑战 - RISC-V应用较多且相对成功的场景是软件简单的嵌入式领域,如微控制器和存储类产品,但物联网需求碎片化导致定制芯片失去规模效应 [21] - RISC-V硬件生态不成熟,缺乏有竞争优势的高性价比处理器核种类和支持多核互连的高性能片上网络 [21] - RISC-V进入以计算机为代表的通用平台还有旷日持久的路程,主要障碍在于软件生态不成熟 [24] - 基于RISC-V指令集扩展支持AI子指令集和后量子密码等创新案例显示其技术可行性,如Tenstorrent等企业开发了基于RISC-V的AI加速计算方案 [30] 自研芯片趋势与统一指令集路径 - 系统和平台厂商重新研发计算芯片,云厂商自研芯片模式可行因盈利基础在增值服务而非硬件,且掌控全栈软硬件使生态移植困难较小 [25] - 苹果公司实现核心产品线处理器全线自研,成功关键在于自研系统软件配合形成优化用户体验,而非单纯芯片自研 [26][27] - 软件定义一切包括成败,指令系统越多软件生态投入越大,当前领域专用架构和其他xPU研发领域出现软件掉队现象 [28][29] - 体系结构创新未必需要新架构,可在现有指令系统框架内实现,统一基于RISC-V指令集开发可避免重复劳动和研发资源浪费 [30]
“?红蓝厂”主导的服务器CPU迎来新势力! NextSilicon携RISC-V架构挑战英特尔与AMD
智通财经· 2025-10-23 15:22
公司概况与产品定位 - 总部位于以色列的芯片初创公司NextSilicon已筹集约3亿美元融资 [2] - 公司正开发一款基于开源RISC-V架构的中央处理器,旨在挑战由AMD和英特尔主导的数据中心服务器CPU市场 [1] - 公司旗舰芯片产品为"Maverick-2"数据流加速器,旨在加速精密科学计算任务,如核武器建模和超音速导弹 [2] - 公司计划推出的RISC-V架构服务器CPU代号为"Arbel",目前仍处于测试芯片阶段,面向高性能计算场景 [5] 技术架构与竞争优势 - NextSilicon采用名为RISC-V的开源架构技术,该技术正被英伟达和博通等芯片巨头大规模采用 [2] - Maverick-2的本质是一款"数据流/可重构"加速器,其计算单元以运行时可重构的图/数据流方式工作,不同于传统CPU/GPU指令流架构 [3] - 芯片内嵌了多颗自研RISC-V内核,用于处理难以并行化但必须高速执行的串行代码 [3] - 公司声称其技术组合能够在无需彻底重写软件代码的情况下,以更快速度和更低功耗执行英伟达GPU的部分同类计算工作 [4] - 相比于x86+GPU的主流范式,NextSilicon的"HPC优先与紧耦合架构"能够减少指令与数据搬运开销,从而提升计算平台能效与吞吐 [6] 市场动态与行业影响 - 服务器CPU市场目前由英特尔和AMD全面主导 [2] - RISC-V作为一种完全开放的指令集架构,正加速渗透服务器领域,与x86和ARM架构形成鼎足之势 [5][6] - 由于英伟达将注意力转向人工智能等低精度大型计算任务,为NextSilicon等初创企业创造了市场机会 [2] - NextSilicon的"Arbel" CPU与Maverick-2加速器旨在组成"主机+加速器"的超算集群,以挑战x86架构+GPU体系的主流范式 [5] 客户验证与发展进展 - NextSilicon的新款CPU正在接受美国桑迪亚国家实验室的全面评估 [1] - 桑迪亚国家实验室已评估由NextSilicon芯片构建的原型计算系统长达三年 [4] - 该实验室高级科学家表示,NextSilicon芯片的"性能结果令人印象深刻",显示出在不需大量软件代码修改的情况下大幅提升复杂计算能力的潜力 [4] - Maverick-2及更先进的加速系列芯片已进入实际量产阶段,而服务器CPU"Arbel"计划不久后大规模量产 [4][5]
“红蓝厂”主导的服务器CPU迎来新势力! NextSilicon携RISC-V架构挑战英特尔与AMD
智通财经网· 2025-10-23 15:15
公司核心动态 - 芯片初创公司NextSilicon正开发一款基于开源RISC-V架构的中央处理器,旨在向AMD和英特尔主导的数据中心服务器CPU市场发起冲击,并与英伟达的HPC算力集群竞争[1] - 公司已筹集大约3亿美元融资,其旗舰芯片产品"Maverick-2"数据流加速器旨在加速精密科学计算任务,如核武器建模和超音速导弹[2] - Maverick-2加速器芯片及其更先进的加速系列已进入量产阶段,公司声称其能在无需彻底重写软件代码的情况下,以更快速度和更低功耗执行英伟达GPU的部分同类计算工作[4] - 公司即将推出的RISC-V架构服务器CPU代号为"Arbel",目前仍处于测试芯片阶段,计划与Maverick-2/3加速器紧耦合,服务超算中心和科学计算等数据中心负载[5][6] 产品技术特点 - Maverick-2是一款"数据流/可重构"加速器,采用非冯·诺依曼范式的智能计算架构,其主计算阵列内嵌了多颗RISC-V内核,用于处理难以并行化但需高速执行的串行代码[3] - Maverick-2的计算单元以运行时可重构的图/数据流方式工作,不同于传统的CPU/GPU指令流架构[3] - 由Maverick-2加速器与Arbel CPU组成的"主机+加速器"超算节点,据称能带来强于英特尔与AMD同类数据中心组合的性价比与能效比[4] - Arbel CPU采用HPC优先与紧耦合架构,能够减少传统CPU/GPU架构中的指令与数据搬运开销,从而大幅提升计算平台的能效与吞吐[7] 市场与行业影响 - NextSilicon的产品将对长期由英特尔和AMDx86架构主导的服务器CPU市场,以及英伟达基于ARM架构开发的Grace CPU构成新的竞争[1][2] - RISC-V作为一种完全开放的指令集架构,正加速渗透服务器领域,与ARM和x86架构形成鼎足之势,未来可能蚕食两者在各自擅长领域的市场份额[6] - RISC-V的开源特性和定制潜力使其便于按研究室的庞大HPC需求进行扩展[7] - 英伟达等芯片巨头正越来越大规模地采用RISC-V架构[2] 第三方评估与认可 - 美国桑迪亚国家实验室三年来一直在评估由NextSilicon芯片构建的原型计算系统[4] - 桑迪亚国家实验室高级科学家表示,NextSilicon芯片产品的性能结果令人印象深刻,显示出在不需要大量软件代码修改的情况下,大幅提升实验室复杂计算能力的潜力[4]
国产ARM谢幕前奏?华为终于祭出RISC-V芯片
是说芯语· 2025-07-31 15:33
华为RISC-V芯片战略布局 - 海思推出Hi3066M与Hi3065P两款RISC-V架构芯片,标志着备胎计划启动,RISC-V或成为战略支点 [1] - Hi3066M面向家电端侧智能化需求,内置eAI引擎,适用于空调、冰箱等AI场景 [2] - Hi3065P针对家电、工业领域,定位高性能实时控制MCU,用于光伏逆变、数字电机控制等 [2] RISC-V技术挑战与瓶颈 - 软件生态不完善,工具链(编译器、调试工具)适配不足,增加开发成本 [2] - 高性能计算能力待提升,单线程性能、内存带宽落后于x86/ARM,乱序执行等技术需优化 [3] - 多核同步与通信效率低,超大规模参数场景下芯片互联效率不足 [3] ARM架构的迭代危机 - 2019年ARM断供后,华为受限于ARMV8旧版本授权,鲲鹏CPU6年未大幅更新 [4] - 鲲鹏芯片实际应用表现不佳,高并发场景性能低于纸面数据,采购价远超同类均价 [4] - ARM生态封闭,华为版本与主流脱钩,形成"孤岛中的孤岛" [7] 生态迁移的连锁反应 - 华为作为产业链主,底层架构切换将导致上层开发者生态重建,原有ARM软件难以复用 [6] - ARM生态封闭性导致应用移植困难,RISC-V生态需完善硬件、工具链、应用软件 [7] - 华为需协调生态伙伴承担迁移代价,推动RISC-V生态开垦 [7] 战略转型的必然性 - ARM路线受美国禁令持续压制,RISC-V开放架构成唯一退路 [5] - 华为需独立完成ARM+竞争对手的工作量,RISC-V赛道另起炉灶突破性能瓶颈 [5][6]
史上最强集显,来了?
半导体行业观察· 2025-07-27 11:17
英伟达N1X SoC性能与规格 - 芯片首次通过Geekbench OpenCL测试揭示GPU性能,配备48个流式多处理器(SM)单元,对应6,144个CUDA核心,与桌面显卡RTX 5070规格一致 [1][2] - CPU架构由两个10核集群组成20核心,基于Grace架构,整颗芯片功耗约120W,工程样品运行频率1.05 GHz时OpenCL得分为46,361分,超越苹果M3 Max和AMD 890M(约37,500分) [2][3] - 采用共享LPDDR5X内存而非独立GDDR显存,性能上限理论可达RTX 5070水平(2.5GHz/250W TDP),当前表现受限于早期功耗与频率设置 [3] 市场定位与竞争策略 - 采用Blackwell架构GPU与ARM CPU集群混合设计,目标平衡AI性能、游戏能力与能效,对标AMD Strix Halo和苹果M系列芯片 [4] - 可能为DGX Spark AI迷你PC所用GB10 Superchip的消费级改版,与联发科协同开发,面向笔记本/台式机市场 [2][5] - 若功耗与带宽优化到位,有望成为首款挑战x86(AMD/Intel)的高性能ARM SoC,并冲击苹果在高端AI笔记本市场的地位 [4] 发布时间与开发进展 - 传闻发布时间从2025年台北电脑展推迟至2026年Q1,后因设计问题可能延至2026年末或CES 2027 [7][8] - 工程样品CPU性能未达惊艳水平,驱动与固件尚不完善,但GPU表现已显示潜力 [4][11] 潜在应用场景 - 笔记本电脑版本(N1)或主打游戏市场,戴尔Alienware可能首发搭载,目标实现轻薄化与长续航,性能对标120W RTX 4070笔记本但功耗仅65W [9][12] - 集成DLSS 4等技术可能提升游戏表现,与AMD Strix Halo(接近RTX 4060桌面性能)及高通骁龙X2形成竞争 [13] 性能预期与行业影响 - 泄露基准显示GB10超级芯片单核2,960分、多核10,682分,但落后于苹果M4 Max [10][11] - 若成功推出,将推动ARM架构在高性能计算领域的渗透,重塑笔记本GPU与CPU市场格局 [5][14]
苹果芯片,完成颠覆?
半导体行业观察· 2025-07-01 09:03
英特尔与x86架构的困境 - 英特尔计划关闭汽车业务并裁员,反映其转型困境 [1] - 苹果宣布macOS 26 Tahoe将是最后一个支持英特尔芯片的版本,标志其与英特尔15年合作终结 [1][19] - x86架构曾凭借"Wintel联盟"垄断PC市场40余年,但近年因英特尔工艺延迟(7nm推迟3年)和AMD Zen架构崛起而份额下滑 [4][5][20] - 英特尔PC处理器份额从2023年77 3%骤降至2025年60%-65%,核心客户订单流向AMD [32] 苹果ARM芯片的颠覆性突破 - 苹果M1芯片2020年发布,性能比肩11代酷睿i7,功耗仅为英特尔一半,打破ARM低性能认知 [18][19] - M系列芯片带动Mac复兴,ARM在PC市场份额从2020年2%跃升至2022年11 3%,2024年Q4苹果占AI PC市场45%份额 [22][23] - 苹果采用台积电5nm/3nm工艺,M3芯片性能较M1提升50%,制程领先英特尔3年 [20][32] - 公司通过统一内存架构和软硬协同优化,重构Mac产品线,实现轻薄设计与长续航 [18][21] ARM阵营的全面崛起 - 高通骁龙X Elite性能超越英特尔/AMD同类产品,已获85款PC设计订单,2026年将超100款 [24][27] - 英伟达2025年推出N1X处理器,Geekbench单核3096分,计划联合戴尔/惠普攻游戏本市场 [30] - ARM架构预计2025年占PC/平板出货40%,数据中心处理器50%份额 [31] - 联发科通过合作切入PC芯片,形成高通-英伟达-联发科联合冲击x86格局 [32][33] 国产厂商的技术突围 - 飞腾腾锐D3000M采用8核自研架构,主频2 5GHz,获联想/中国长城采用 [35] - 海思麒麟X90主频4 2GHz,Geekbench多核11640分,超越苹果M2 [35] - 此芯科技P1芯片集成12核ARM+45TOPS AI算力,支持Windows AI PC [35] - RISC-V架构受达摩院/赛昉科技等青睐,推动x86-ARM-RISC-V三足鼎立 [36][39] 行业格局的深层变革 - PC处理器从x86单极转向多元竞争,ARM凭借能效优势切入AI PC/AR/VR新场景 [32][33] - 苹果垂直整合模式颠覆英特尔渐进式创新,成为"规则重塑者" [33] - 开源RISC-V与ARM开放授权形成对x86封闭生态的合围 [38][39] - 技术代差(台积电vs英特尔制程)、生态控制力(苹果全栈整合)和AI布局成竞争关键 [20][32][33]
机器人底层操作系统专家
2025-05-27 23:28
纪要涉及的行业和公司 - **行业**:机器人、自动驾驶、汽车 - **公司**:英伟达、高通、英特尔、瑞芯微、新产、华为、海光、宇树科技、智源机器人、Mobileye、比亚迪、大疆、东土科技、南京易辉 纪要提到的核心观点和论据 - **机器人底层操作系统的定义和作用**:介于硬件驱动和上层应用软件之间,负责管理和协调硬件资源,包括感知、交互、指令理解与执行、运动控制等模块,为上层应用开发提供接口,确保任务实时性和数据处理效率[2] - **操作系统应对不同任务数据处理需求的方式**:通过定时器和任务切换机制,如视频信号处理每40 - 50毫秒处理一帧,运动控制每毫秒采集一次六维力传感器数据并计算,还需为复杂任务提供时间调度机制[4] - **机器人中计算资源的调用管理**:由操作系统内核管理,AI或视觉大模型处理调用NPU或AI加速卡,实时性高的运动控制由CPU直接完成,RTOS分配固定CPU核心给特定业务[5] - **操作系统在机器人中的关键功能**:屏蔽底层硬件读写,提供数据接口;保证任务实时性;管理计算资源,优化性能满足复杂功能需求[6][7] - **操作系统与硬件选型的绑定情况**:自动驾驶和机器人领域常使用高集成度芯片,操作系统需与之深度绑定以优化虚拟化资源划分、提高开发效率,但会带来技术依赖[7] - **选择底层操作系统的考虑因素**:需考虑未来数据处理能力和成本,英伟达方案全面但昂贵,量产企业可考虑高通、英特尔或国产芯片,避免技术栈依赖[8][9] - **当前机器人底层操作系统选型趋势**:呈现多样化,部分企业为快速推出产品选英伟达,批量生产时转向性价比高的方案,企业需根据应用场景灵活搭配[10] - **更便宜芯片替代方案的影响**:可解决部分问题,但需在技术研发和供应链管理上投入更多精力,不同芯片厂商有不同定位[10] - **量产阶段有潜力的芯片**:高通和英特尔在集成化SoC方面潜力大,高通在非高算力场景表现出色,英特尔Core Ultra架构适用于工业机器人和运动控制器[11] - **国产芯片值得关注的公司**:华为对标英伟达,瑞芯微性价比高,海光受制裁制程受限,瑞芯微在国产市场可能发展更快[12] - **X86架构适合机器人应用的原因**:在浮点运算能力上优于ARM、RISC - V,适合机器人大量矩阵计算场景[13][14] - **X86架构在机器人应用中功耗优化方式**:利用英特尔X86架构处理器睿频特性,操作系统可让部分核心以最高频率运行处理实时任务,其他核心以基频运行处理非实时任务[15] - **国内机器人企业底层系统开发特点**:宇树科技自研操作系统和通信协议,实现高效运动控制通信;智源机器人自研分布式通信中间件,强调全自主研发;小型企业可能与专业公司合作[16] - **机器人领域开发趋势**:大型本体厂商未来可能自行开发底层操作系统,目前小型企业依赖专业公司,行业规模扩大后可能出现本体厂商吸收合并底层技术公司的情况[17] - **自动驾驶领域突出公司及合作情况**:Mobileye计划上市并为整车厂提供产品,比亚迪与Mobileye合作,大疆自主研发自动驾驶技术,部分国内整车厂自行研发关键技术[18] - **国内外企业技术研发差异**:国内企业竞争激烈、边界模糊,常自研关键技术;国外企业契约精神强,上下游分工明确[19] - **机器人行业发展现状和厂商类型**:存在“打铁公司”,靠低价占据市场,做操作系统和控制器的厂商有市场机会[20] - **机器人与汽车生产属性及发展趋势**:机器人生产类似家电,本体厂商可能贴牌生产,第三方公司成长性机会大;汽车需全程自研[21] - **机器人推向量产的瓶颈和操作系统问题**:瓶颈包括算法、数据和芯片问题,操作系统需解决集成AI能力、运动控制实时响应和业务隔离等问题[22] - **机器人领域系统融合问题及解决情况**:工业领域已有类似应用,但人形机器人领域因开发者习惯和操作系统虚拟化、隔离性及通信中间件问题,尚未解决[23] - **底层操作系统的商业模式**:软件授权和硬件绑定销售可能性较大,软件license费用可参考工业机器人或数控机床,每台500 - 1000元[24] - **机器人制造商采购操作系统的模式**:一是购买纯软件自行完成硬件板子再适配;二是委托操作系统厂家开发整套硬件并适配[25] - **机器人控制系统的硬件配置**:通常分为大脑和小脑两个独立硬件板块,如北京银行天宫系统采用两块大脑板子和一块小脑板子[26][27] - **未来机器人操作系统的发展趋势**:将大脑和小脑等硬件板子整合到一个完整操作系统中,如英伟达Isaac方案[28] 其他重要但可能被忽略的内容 - **鸿蒙操作系统开源的影响**:开源不意味着可直接使用,无强研发能力的团队难以优化到理想状态,部分工业企业选择收费服务且系统不开源或定向开源[29] - **开源与闭源在机器人操作系统中的安全性权衡**:开源有助于社区发展,但带来安全风险,人形机器人普及后安全性成关键问题,部分厂家选择闭源或定向开源[30][31]
下一代微软游戏机,放弃x86
半导体行业观察· 2025-05-18 11:33
微软下一代Xbox硬件转变 - 下一代Xbox游戏机可能放弃AMD芯片,转而采用基于ARM架构的高通骁龙芯片,标志着硬件设计的重大转变[1][2] - 高通官方销售总监透露,微软正与高通合作开发基于骁龙解决方案的下一代Xbox产品,几乎证实了ARM架构的引入[2][3] - 这一转变意味着微软可能结束十多年来对AMD x86架构的依赖,使下一代Xbox更接近游戏机与PC的混合体[2] 下一代Xbox的功能与定位 - 下一代Xbox可能运行Windows系统,支持多种软件,包括通过模拟器运行的经典Xbox游戏,甚至可能支持Steam和Epic等第三方PC游戏商店[2] - 微软计划在2027年推出下一代Xbox,目标是打造迄今为止最灵活、最具前瞻性的系统,整合PC功能、ARM硬件和扩展的游戏库[3] - 招聘信息显示,微软正在积极定义下一代Surface和Xbox产品组合,强调与内外利益相关者的合作[3] 行业影响与趋势 - 微软的这一举措可能彻底改变人们对游戏机的看法,使其功能更接近PC,同时保留游戏机的特性[1] - 高通与微软的合作可能进一步推动ARM架构在游戏硬件领域的应用,挑战传统x86架构的主导地位[2][3] - 行业传闻和招聘信息均指向微软正在大力押注下一代Xbox的差异化,包括硬件创新和软件生态的扩展[2][3]