Workflow
Graviton4
icon
搜索文档
最强Arm CPU发布:192核,3nm工艺
半导体行业观察· 2025-12-05 09:46
亚马逊Graviton5芯片发布 - 亚马逊在re:invent大会上发布Graviton5,这是其迄今为止密度最高、性能最强的CPU,将192个处理器核心集成于单个插槽中,承诺将AWS性能提升至新水平 [1][3] - 自2018年首次推出以来,Graviton芯片已成为AWS计算服务的主力军,过去三年中,Graviton芯片的新增CPU容量占比超过一半 [1][3] Graviton5技术规格与性能 - 核心与工艺:Graviton5配备192个采用台积电3nm工艺制造的Arm Neoverse V3内核 [1][4] - 缓存系统:L3缓存容量从Graviton4的36MB大幅提升至192MB,增长5.3倍,每个核心的缓存容量从376KB提升至1MB [2][11] - 内存性能:芯片配备改进的内存子系统,速度提升至7200 MT/s,并正在开发对8800 MT/s DIMM的支持 [1][4] - 核心间延迟:更高的核心数量可有效降低核心间延迟约三分之一(33%),从而提升特定工作负载性能 [5][11] - 整体性能:基于Graviton5的新款M9g实例整体性能比基于Graviton4的M8g实例提升25% [3][5][11] - 核心密度:M9g实例拥有Amazon EC2中最高的CPU核心密度,单个实例包含192个核心 [11] 芯片设计与架构创新 - 核心数量跃升:从Graviton4的96个核心跃升至192个核心,这一重大提升可能得益于工艺节点微型化或Chiplet(芯粒)技术 [1][2][6] - 内存控制器:从Graviton3开始,内存控制器采用独立芯片设计并以芯粒形式集成,Graviton5至少在内存控制器领域应用了该技术 [2] - 单插槽设计:Graviton5将192个核心整合到单个插槽中,性能足以与AMD(192核)和Intel(144核)最高核心数的CPU相媲美 [3][5] - 互连与I/O:Graviton5将是首款开箱即支持PCIe 6的服务器CPU,与首款支持PCIe 5.0的Graviton3类似 [6] 系统集成与配套技术 - Nitro系统:Graviton5实例基于AWS Nitro系统构建,利用第六代Nitro卡将虚拟化、存储和网络功能卸载到专用硬件 [12] - 网络带宽:对于AWS M9g实例,Graviton5与定制的Nitro 6智能网卡配合,使网络带宽翻倍至100 Gbps [6] - 带宽提升:平均而言,各种实例大小的网络带宽提高15%,Amazon EBS带宽提高20%,最大实例的网络带宽提高一倍 [12] - 计算节点配置:实际计算节点包含两个插槽,并共享一个Nitro智能网卡 [6] 市场定位与客户反馈 - 设计理念:Graviton芯片旨在打造一款能够服务于多种角色、实现高利用率以降低成本的通用产品 [6] - 客户性能测试: - Airbnb测试发现其性能比同代其他系统架构提升高达25%,比Graviton4实例提升高达20% [14] - Atlassian在测试中观察到与上一代产品相比,性能提升30%,延迟降低20% [14] - 西门子数字化工业软件早期测试显示,Graviton5性能较Graviton4进一步提升了30% [15] - SAP在SAP HANA Cloud上观察到OLTP查询性能提升35%至60% [15] - Synopsys的早期测试结果显示,其EDA工具运行时间提升高达35%,VCS运行速度提升高达40% [15] 行业竞争格局 - 微软:发布了代号为Cobalt 200的第二代Arm CPU,基于Arm Neoverse V3,采用台积电3nm工艺,拥有132个活动核心,共享192 MB L3缓存 [8] - 谷歌:推出了Axion系列实例,每个实例最多配备72个Arm Neoverse V2核心,辅以576GB内存和100Gbps网络带宽 [8] - Oracle:运营着规模最大的基于Arm架构的Ampere CPU集群之一,发布了基于192核AmpereOne M处理器的实例 [9] 产品发布与路线图 - 实例发布:基于Graviton5的M9g通用实例已推出预览版 [7][15] - 未来计划:更多计算优化型(C9g)和内存优化型(R9g)实例计划于2026年发布 [7][15] - 全栈自研:亚马逊在最新的UltraServers AI机架系统中首次放弃了x86内核,转而采用包括Graviton、Trainium和Nitro在内的全套自研硅芯片 [7]
亚马逊云科技:Agentic AI时代即将开启!
搜狐财经· 2025-06-20 08:59
行业趋势与AI发展 - AI技术浪潮正引发从技术架构到商业模式的颠覆性变革,企业普遍面临战略调整需求 [3] - 生成式AI快速落地推动智能体AI(Agentic AI)技术爆发,企业需在管理与技术双重维度做好准备 [3][6] - Agentic AI将成为企业变革关键引擎,贯穿提升生产力、优化运营、重塑产品及驱动商业模式创新 [6] 亚马逊云科技战略与布局 - 公司在中国市场聚焦两大核心战略:助力中国企业全球化、支持本地及跨国企业利用中国区域云服务驱动AI创新 [4] - 推出中国区域客户智能体AI实践指南,提供从架构设计到场景落地的全流程方法论 [4][11] - 构建"三横一纵"全球化服务架构,横向覆盖基础设施/安全合规/生态资源,纵向穿透行业场景 [11] 技术能力与基础设施 - 自研Graviton4处理器性能显著提升:数据库应用性能+40%,大型Java应用性能+45%,支持生成式AI推理 [8] - 过去两年超50%新增CPU容量采用Amazon Graviton芯片 [10] - 全球基础设施覆盖245个国家和地区,提供240+全栈云服务及自研AI加速芯片组(如Trainium) [10] 客户案例与商业价值 - 德勤使用Amazon Q使开发速度提升40%,测试时间降低70% [6] - 美客多通过Amazon Bedrock实现生成式广告展示次数+45%,点击率+25% [6] - 公司通过技术赋能与战略咨询结合,帮助金融/制造等领域企业将合规能力转化为竞争优势 [12] 企业实施路径建议 - 管理维度需构建认知体系、优化组织流程、升级人才结构并夯实数字化底层能力 [7] - 技术维度需聚焦安全合规、系统韧性、架构可扩展性及技术前瞻性四大基石 [7] - 打通数据壁垒实现高效治理是解锁Agentic AI价值的前提,需制定务实推进策略 [7]
AWS' custom chip strategy is showing results, and cutting into Nvidia's AI dominance
CNBC· 2025-06-18 04:50
AWS Graviton4芯片更新 - AWS即将发布Graviton4芯片更新 网络带宽达600GB/秒 为公有云领域最高水平 [1] - 芯片速度相当于每秒读取100张音乐CD [1] - Graviton4由亚马逊Annapurna Labs研发 采用定制化策略 直接对标英特尔和AMD [2] 亚马逊AI基础设施布局 - AWS在re:Invent 2024大会上公布Project Rainier AI超级计算机 专为Anthropic打造 [3] - 公司已向Anthropic投资80亿美元 [3] - 目标降低AI训练成本 替代英伟达高价GPU [3] 芯片市场竞争格局 - Anthropic的Claude Opus 4模型基于Trainium2 GPU训练 [4] - Project Rainier采用超50万颗Trainium2芯片 该订单传统上属于英伟达 [4] - 核心竞争从CPU转向AI基础设施领域 主要对手为英伟达 [2][4]
电子行业深度报告:算力平权,国产AI力量崛起
民生证券· 2025-05-08 20:47
报告行业投资评级 - 推荐 维持评级 [6] 报告的核心观点 - 国产大模型持续突破,豆包、DeepSeek、MCP等引领全球AI产业发展,加速AI应用落地 [11] - 芯片厂商加速适配国产算力生态,中芯国际、昇腾等在制程和性能上取得进展,云端ASIC成算力演进主流 [2][55] - 国内云计算厂商加大算力储备及模型优化投入,算力基建布局清晰,供需关系改善,算力租赁和本地化部署需求增长 [3] - AI浪潮下,单机柜功率密度提高,电源及温控系统需创新,液冷市场增速快,相关零部件受益 [4] 根据相关目录分别进行总结 1 豆包+DeepSeek破局,国产大模型弯道超车 - 豆包专注多模态融合,2024年补全语音、图像等能力,12月发布视觉理解模型,成国内领先多模态大模型之一 [11] - DeepSeek专注深度思考+轻量化,2024年12月发布DeepSeek - V3,成本低性能顶尖,2025年1月发布DeepSeek - R1,性能追平OpenAI - o1正式版,国内外获高度认可 [12] - MCP重新定义模型和数据交互模式,推动AI Agent落地,为AI模型连接数据源和工具提供标准化方式 [13] - DeepSeek由幻方量化创立,得益于母公司前瞻性布局,发展迅速,其核心优势在于创新算法,如DeepSeekMoE、MLA、MTP、GRPO等,性能出色 [16][18] - 国产模型竞速升级,豆包、通义千问等在轻量化方面取得进展,如豆包发布Doubao - 1.5 - pro,通义千问发布QwQ - 32B等 [34][35] - 大模型轻量化以更低门槛激发推理场景与需求,DeepSeek开创低成本大模型范式,带动推理需求增长,用户高速增长,推动AI原生APP用户规模扩张 [40][41][48] 2 向"芯"而行,国产算力破局元年 - 中芯国际是全球领先晶圆代工企业,在成熟制程28nm实现突破,先进制程围绕FinFET路线演进,N + 1工艺成熟,N + 2持续推进,财务表现亮眼,营收有望稳健增长 [56][57][58] - 华为昇腾通过自研推理引擎优化昇腾910B与DeepSeekR1系列模型适配,性能接近高端GPU;昇腾910C算力提升,与DeepSeek深度优化,华为云超节点突破,920研发加速,昇腾与DeepSeek适配加速算力渗透,依托供应链维持稳定出货 [59][62][63][64][65][66] - 寒武纪聚焦AI芯片,思元590性能对标A100,软件生态完善,2025年Q1营收和利润大幅提升 [71][72][73][76] - 海光信息围绕CPU和DCU布局,DCU产品算力优势显著,适配多种模型,2025年Q1营收和利润增长,订单需求旺盛 [77][78][81][82] - 云天励飞深耕算法与芯片,硬件产品迭代,推出自研大模型体系,与华为合作打造一体机,2025年Q1营收增长,亏损幅度改善 [83][84][86][88] - 云厂商自研ASIC比例逐步提升,谷歌、Meta、微软、亚马逊等均有布局,芯原股份和翱捷科技是国内顶尖ASIC设计公司,研发实力强劲 [89][93][94][95][99][100][101] - 国产芯片厂商加速与国产大模型适配,以DeepSeek为例,其适配推动国产算力平台成熟和生态完善,降低算力成本,吸引开发者和企业加入国产AI生态 [104][105][106] 3 算力基建加码,解决供给短板 - 国内云计算厂商加大算力储备及模型投入,资本开支高增,行业供需关系改善,云计算商业模式有望“量价齐升” [3] - 国产算力基建元年,构建算力云服务新生态,华勤、浪潮等推出适配国产算力的服务器,算力租赁成短期内破局之道,本地化部署需求旺盛,助推AI一体机发展 [3] 4 电源及液冷创新,解决功率密度瓶颈 - 全新电源架构升级,供电系统从UPS向HVDC演进,超级电容成全新增量 [4] - 液冷接棒传统风冷,科智咨询预计23 - 27年国内液冷市场复合增速达60%,冷却液、CDU等上游零部件受益 [4] 5 行业投资建议 - 建议关注算力芯片、服务器、电源、温控及其他供应链相关公司,如中芯国际、华勤技术、禾望电气、申菱环境、德明利等 [5]