超威半导体(AMD)
搜索文档
AMD苏姿丰:联想是Helios AI架构的首批系统供应商|直击CES
新浪财经· 2026-01-07 10:40
行业趋势与市场需求 - 全球企业正致力于将AI部署更贴近自身数据,同时保持系统灵活性和可演进能力 [1][3] - AI应用将无处不在,广泛存在于数据中心、工厂、医院、个人电脑及边缘设备中 [1][3] - 企业需要在云端、本地和边缘自由部署AI,并能基于自有数据及业务需求,灵活选择CPU、GPU与软件的最佳组合 [1][3] - 随着AI推理需求加速增长,企业需求从单台服务器转向能够支撑更大模型、更高吞吐量的系统,使得机架级AI基础设施变得越来越重要 [2][4] 公司战略合作与产品发布 - AMD与联想达成合作,联想将成为首批采用AMD Helios机架级AI架构的系统供应商之一 [1][2][3][4] - 双方将合作推出搭载AMD EPYC处理器的AI推理服务器ThinkSystem SR675i [1][3] - AMD于1月6日发布了其最新的机架级计算平台Helios,该架构被视为向竞争对手英伟达发起挑战 [2][4] 产品价值主张 - 联想ThinkSystem SR675i推理服务器旨在提供强大的本地AI推理能力,帮助客户获取实时洞察并加速决策流程 [1][3] - 该产品有助于确保企业数据的安全 [1][3]
AMD苏姿丰:目前全球算力远远不足,未来5年需要提升100倍
格隆汇· 2026-01-07 10:17
公司动态与产品发布 - 超微半导体公司董事会主席兼行政总裁苏姿丰在国际消费电子展开幕前围绕AI进行了主题演讲 [1] - 公司发布了多款AI芯片,其中包括AI芯片MI450及Helios机枱 [1] - 公司预告MI500系列处理器将于2027年问世 [2] 行业趋势与市场展望 - AI浪潮将持续发展,但相对于可能实现的目标,目前的算力远远不足 [1] - AI正快速从工具进化为基础建设 [1] - 全球算力需求未来5年将从目前的Zetta等级,推升100倍,至10 YottaFLOPS [1] - 全球运算规模较2022年暴增一万倍 [1] - 这样的跨世代跳跃,背后仰赖的不只是系统架构创新,更取决于制程技术的极限突破 [1] 产品性能与技术路线 - 预告的MI500系列处理器效能将可达到2023年首次推出的MI300系列的1000倍 [2]
硬刚黄仁勋,AMD祭出「千倍算力大杀器」,「反黄联盟」崛起
36氪· 2026-01-07 09:59
行业竞争格局 - 全球AI算力市场呈现英伟达与AMD两大巨头激烈竞争的“双城记”格局,英伟达试图通过封闭生态构建“围墙花园”,而AMD则通过结盟开放标准率领“复仇者联盟”试图打破垄断 [1] - 英伟达在CES上发布了下一代Vera Rubin平台,由Rubin GPU、Vera CPU和NVL144机架构成,试图通过软硬件一体化与私有标准进一步巩固其垄断地位,定义未来AI数据中心形态 [4][5][10][12] - AMD在CES上发起了绝地反击,通过发布Helios AI机架、MI455X芯片及开放生态联盟,试图重写AI算力世界的权力版图 [1][15] 英伟达Vera Rubin平台技术细节 - Rubin GPU将配备下一代HBM4内存,其带宽达到22 TB/s,是前代Blackwell平台的2.8倍,晶体管数量达到3360亿个 [5][6] - Vera CPU基于Arm架构深度自研,拥有88个自定义核心和176个线程,意图通过超级芯片设计在高端AI服务器中逐步剔除x86架构 [8] - NVL144机架单机架集成144颗GPU,通过NVLink 6互联,带宽达到惊人的260TB/s,是“数据中心即计算机”理念的终极形态 [10] - 英伟达战略重点转向Agentic AI,声称Rubin平台能将推理Token的成本降低10倍,以应对指数级增长的推理算力需求 [13] AMD战略与产品发布 - AMD提出“Yotta Scale Compute”(尧字节级计算)的宏大目标,即每秒10²⁴次浮点运算,并计划未来5年部署10万台El Capitan级(百亿亿次级)超级计算机 [19] - 公司判断AI算力需求正经历前所未有的暴涨,预计将增长10,000倍,并且推理Token的数量在过去两年里增加了100倍 [21][25] - AMD发布了以希腊太阳神命名的“Helios”AI机架,作为其开放架构战略的集大成者,正面硬刚英伟达的封闭系统 [24][27] Helios AI机架技术规格 - Helios机架集成72颗Instinct MI455X GPU,并首次确认搭载4,600个“Zen 6”x86 CPU核心,坚守x86生态以对抗英伟达的Arm架构 [28][30] - 机架采用31 TB HBM4内存,采用“暴力美学”的大显存策略来应对大模型训练的“内存墙”瓶颈,并减少对高速互联的依赖 [28][30] - 互联技术采用开放的UALink标准与Ultra Ethernet (UEC),直接对标英伟达私有的NVLink与InfiniBand,旨在降低客户总拥有成本 [28][38][44] - 制造工艺采用先进的2nm/3nm技术,生态系统基于OCP Open Rack开放标准,与英伟达的私有MGX生态形成鲜明对比 [28] AMD Instinct MI455X芯片 - Instinct MI455X GPU相比前代MI355X实现了10倍的性能跃迁,这主要得益于新的CDNA架构和制程红利 [33] - 芯片坚持OAM模组化设计,提供即插即用的灵活性,允许客户保留原有服务器基础设施进行升级,是一种“反锁定”成本策略 [33] - AMD展示了清晰的未来路线图,承诺基于CDNA 6架构和2nm工艺的MI500系列将在2027年推出,并计划在4年内实现AI性能1000倍的提升 [34][36] 互联与生态战略 - AMD联合英特尔、微软、Meta、谷歌、博通等巨头成立UALink联盟,制定开放加速器互联标准,UALink 1.0支持多达1024个加速器互联并支持显存池化,直接挑战NVLink霸权 [40][41][42] - 公司押注Ultra Ethernet Consortium (UEC) 作为节点间互联方案,研究显示其每GFLOP成本比英伟达的InfiniBand方案低27%,以此打破英伟达在高性能网络市场的垄断 [44][46] - 该开放生态战略得到了包括OpenAI、微软、Meta在内的核心客户支持,这些科技巨头因恐惧供应商锁定而积极支持AMD作为“第二供应商” [42][64] 端侧AI与PC市场布局 - AMD发布了Ryzen AI Max系列处理器,其最大亮点是配备128GB统一内存,成为首款能运行2350亿参数大模型的x86处理器,直接对标苹果M系列芯片 [50][53] - 性能对比显示,Ryzen AI 400系列在内容创作上比英特尔Core Ultra 9快1.7倍,多任务处理快1.3倍;在AI Token生成速度上比苹果M5快1.4倍 [55][56] - 在每美元Token生成效率上,Ryzen AI Max是英伟达DGX Spark工作站的1.7倍,旨在为开发者提供高性价比的“微型超算” [56] - 公司还发布了Ryzen AI Halo开发者平台,预装ROCm软件栈并优化主流AI框架,试图提供软硬结合的体验以吸引开发者生态 [57][59] 合作伙伴与软件生态 - OpenAI作为核心合作伙伴站台,其总裁Greg Brockman透露公司算力规模几乎每年翻倍甚至三倍增长,对AMD作为“二供”以获取议价权和供应链安全有强烈需求 [64][66][68] - AMD的ROCm软件生态取得显著进展,通过获得PyTorch等高层框架的广泛支持,以及OpenAI Triton语言的优化,正在削弱开发者对底层CUDA的依赖 [69][70][72] - 众多行业巨头如Hugging Face、Databricks出现在AMD的合作伙伴名单中,表明其“农村包围城市”的软件生态战略正在奏效 [62][69] 市场前景与行业影响 - AMD掌门人苏姿丰预测,五年内全球将有50亿人每天都在使用AI,这将驱动算力需求持续指数级增长 [73][75] - AI应用场景正迅速扩展,例如李飞飞团队展示的AI生成3D世界技术,预示着游戏、虚拟世界等内容创作门槛将被彻底打穿 [78][80] - 本次CES发布会标志着“反英伟达联盟”的誓师,AMD代表了开放、利润共享的“安卓”路线,与英伟达封闭、极致的“苹果”路线形成战略对立 [86] - 行业分析认为,AMD的开放战略为渴望低成本、普惠AI算力的整个产业提供了关键替代选项,有助于维持市场竞争与创新活力 [88]
CES2026半导体杀疯了,四大巨头齐出AI王炸,PC、机器人赛道全面开火
36氪· 2026-01-07 09:59
行业整体风向 - 半导体行业焦点从比拼核心数、主频等硬参数,转向“算力如何服务AI” [26] - 未来方向是将算力做“便宜”、做“高效”、做“场景化” [26] - 预计将看到更多主打高能效、长续航的AI PC上市,改变整个PC生态 [26] 英伟达 - 原预期在CES登场的消费级游戏显卡RTX 50 Super系列缺席 [2] - 发布DLSS 4.5,将多帧生成上限从4帧升级到6帧,为RTX 50系显卡用户带来免费50%帧数提升 [2] - DLSS 4.5新增动态多帧生成功能,并升级G-SYNC Pulsar技术,实现超过1000Hz动态帧率支持 [4] - 发布第二代Transformer模型,所有RTX系显卡用户可通过NVIDIA app使用以增强DLSS画面表现 [4] - 重头戏为Vera Rubin超级计算平台全面量产,包含Vera CPU和Rubin GPU [4][6] - Vera CPU拥有88个Olympus核心,支持高达1.5TB系统内存,单线程性能较前代提升2倍 [4] - Rubin GPU拥有3360亿个晶体管,比前代Blackwell增加1.6倍,FP4推理性能实现5倍增长,采用HBM4显存和第三代Transformer引擎 [6] - Vera+Rubin平台配合BlueField-4 DPU,能让Token成本降低10倍,大幅降低云端AI推理和模型训练成本 [6] 高通 - 发布骁龙 X2 Plus芯片,采用第三代Oryon混合架构和台积电3nm工艺,分为10核及6核版本 [7][9] - 骁龙 X2 Plus核心主频最高达4.04GHz,运行功耗降低43%,对比前代骁龙X Plus单核性能提升35% [9] - 骁龙 X2 Plus拥有高达80TOPS的AI算力,可支撑实时翻译、端侧AI模型部署等功能,旨在降低长续航AI PC入门门槛 [9] - 发布首款机器人专用处理器Dragonwing IQ10平台,针对工业级自主移动机器人和全尺寸人形机器人设计 [9][11] - Dragonwing IQ10在同等性能下能效比同类产品提升30%,可延长机器人续航1到2个小时 [11] - Dragonwing IQ10硬件层级原生支持VLA和VLM模型,使机器人能直接理解自然语言指令并规划动作 [11] 英特尔 - 正式发布采用Intel 18A制程的第三代酷睿Ultra处理器 [13] - Intel 18A是全球首个同时采用RibbonFET和PowerVia技术的制程,可实现15%每瓦性能提升和30%芯片密度提升 [16] - 第三代酷睿Ultra的CPU性能相比上一代Lunar Lake提升60% [16] - 在播放4K流媒体视频时,第三代酷睿Ultra功耗仅为前代的近三分之一,续航可达以“天”为单位 [16] - 第三代酷睿Ultra集成全新B390显卡,核心数增加53%,游戏性能相比上一代暴涨77% [16] - 第三代酷睿Ultra平台最高算力达180TOPS,支持最高96GB内存,可直接端侧部署700亿参数AI大模型 [20] - 官宣基于Panther Lake架构的PC掌机处理器,意图搅局被AMD统治两年的PC掌机市场 [20] AMD - 发布Ryzen AI 400系列处理器,共7款,规格从4核8线程到12核24线程,最高主频5.2GHz,最高AI算力60TOPS [21] - Ryzen AI 5 430虽为4核8线程,但拥有50TOPS算力,确保AI PC体验基础 [23] - 更新Ryzen AI Max+系列,新增392和388型号,GPU核心从32个升级为40个,提升AI性能以迎合便携高性能AI PC需求 [23] - 新增桌面端Ryzen 7 9850X3D处理器,核心数与非3D版一致,缓存翻倍,主打电竞游戏需求 [24] - 在35款游戏平均测试中,Ryzen 7 9850X3D性能比Ultra 9 285K高出约27% [25]
CES2026:AMD发布新一代P100嵌入式处理器
新浪财经· 2026-01-07 09:51
在今天的CES展会上,AMD嵌入式平台介绍了两大系列产品:锐龙AI嵌入式P100系列以及锐龙AI嵌入 式X100系列产品。主要应对边缘AI市场的需求。覆盖人工智能、汽车辅助驾驶、医疗、机器人等等相 关领域。提供高性能、高精度、快速响应与低功耗的使用场景。 根据AMD的介绍,锐龙AI嵌入式P100系列在今天正式发布,该系列采用4纳米制程工艺搭载,CPU方面 能够提供4-6个核心,配备1MB L2缓存及8MB L3缓存,实现可预测时延包含512位宽的AVX-512指令集 以及VNN1/BF16,可用于AI运算,集成10GbE w/TSN与Infinity Fabric。同时功耗只有15-54W,并且拥 有极长的寿命,能够在24×7的全天候高强度运行支持十年生命周期。 性能上,锐龙AI嵌入式P100系列的CPU得益于Zen5架构的加持,在SPECrate@2017的测试中,单线程多 线程性能相较于上代提升2倍以上,支持可靠多任务处理,适配汽车、工业、客户端等场景。 GPU方面锐龙AI嵌入式P100系列搭载了RDNA 3.5架构,渲染性能提升35%,支持4K-8K高保真显示, 低时延流式播放,减轻CPU负担,适配高密 ...
从入门到旗舰:上班族装机不可错过的五大CPU
新浪财经· 2026-01-07 09:45
行业趋势与市场定位 - 中央处理器是提升办公生产力的核心投资,其性能直接影响多任务处理、大型文件操作及内容创作效率 [1][5] - 市场产品覆盖从基础办公到高性能创作的多样化场景,价格区间从千元内实用之选到近五千元专业级产品 [1][4][5][7] - 选择适合自身需求且具备高性价比的处理器能延长设备使用寿命并优化工作节奏 [1][5] 英特尔公司产品分析 - **入门级产品**:酷睿 i5-10400F售价880元,采用6核12线程设计及14nm工艺,功耗65W,适合预算有限的职场新人或家庭办公族进行多任务办公和轻度图像处理 [1][5] - **中端主力产品**:酷睿 i5-13490F售价1599元,采用10nm工艺,配备10核16线程,最大睿频4.8GHz,支持DDR5与PCIe 5.0,适合专业人士处理办公、轻度设计和编程编译 [2][6] - **基础办公产品**:酷睿 i3-12100售价990元,采用4核8线程设计,基础频率3.3GHz,搭载12MB缓存并支持DDR5内存,适合轻负载用户进行日常办公和简单数据处理 [2][6] - **旗舰性能产品**:酷睿 i9-14900K售价4999元,采用24核32线程设计,性能核睿频高达6.0GHz,支持ECC内存,适合对系统稳定性与响应速度有极致要求的金融分析师、设计师等专业用户 [4][7] AMD公司产品分析 - **未来旗舰产品**:Ryzen 9 9950X3D基于Zen 5架构与4nm工艺,配备16核32线程,最大加速频率达5.7GHz,并拥有128MB L3缓存,定位为2025年旗舰,适合高强度视频渲染、3D建模等专业任务 [4][7] 产品技术特征与适用场景 - 工艺制程从14nm到4nm不等,更先进的制程通常带来更好的能效和性能,例如10nm的i5-13490F和4nm的Ryzen 9 9950X3D [1][2][4][5][6][7] - 核心与线程数量是衡量多任务处理能力的关键指标,从4核8线程到24核32线程,满足不同负载需求 [1][2][4][5][6][7] - 平台扩展性是企业长期投资考虑因素,例如LGA1700和AM5插槽为未来升级提供路径,DDR5和PCIe 5.0支持则保障了未来扩展能力 [2][4][6][7] - 特定技术如智能缓存、神经加速器3.0、EXPO内存优化技术等,旨在进一步优化系统调度、流畅度及高频稳定性 [2][4][6][7]
游戏玩家的性价比之选:AMD APU全系推荐
新浪财经· 2026-01-07 09:45
综合来看,这些APU产品覆盖了从百元入门到近四百元进阶的不同需求层级,既有适合收藏玩家的老平 台经典,也有具备现代兼容性的高效能型号。对于不愿投入高昂显卡成本的用户来说,它们提供了实实 在在的游戏与生产力解决方案,让每一分预算都落到实处。 深夜屏幕微光闪烁,键盘轻响间角色跃动于虚拟战场——对许多预算有限却渴望流畅体验的玩家而言, 一块性能均衡、自带核显的处理器,往往是开启数字世界的钥匙。无需额外购置独立显卡,既能应对日 常学习工作,又能在闲暇时运行主流网游,这正是AMD APU的独特魅力。它们以出色的集成图形性能 和亲民价格,成为学生族、入门玩家和家庭用户的理想选择。尤其在构建低成本HTPC或小型办公娱乐 一体机时,这类处理器展现出极高的实用性与灵活性。 首先登场的是AMD APU A6-9400,虽然当前标价为0.0元,但其作为AM4平台早期产品仍具参考价值。 基于28nm工艺打造,配备双核双线程设计,基础频率3.0GHz,加速可达3.2GHz,搭载Radeon R5核 显,拥有384个流处理器,在720MHz默认频率下可提升至1029MHz。配合DDR4-2400内存,足以支撑 1080p分辨率下的《英雄 ...
AMD最强的两颗芯片,首次曝光
半导体行业观察· 2026-01-07 09:43
AMD在CES 2026展示的新产品与技术 - 公司在CES 2026上首次公开展示了下一代Venice系列服务器CPU和MI400系列数据中心加速器[1] - 公司还宣布MI400系列将新增第三款产品MI440X,与MI430X和MI455X共同组成该系列,MI440X专为8路UBB机箱设计,可直接替代MI300/350系列[5] - 公司发布了Venice-X,这很可能是Venice的V-Cache版本,如果每个32核心CCD拥有高达384MB的L3缓存,整个芯片的L3缓存总量可达3GB[6] - Venice和MI400系列都将于2026年晚些时候发布[6] Venice服务器CPU的架构与规格 - Venice处理器采用了更先进的封装方式,类似于Strix Halo或MI250X,并且似乎配备了两个I/O芯片,而不是之前EPYC CPU的单个I/O芯片[1] - Venice芯片包含8个CCD,每个CCD有32个核心,因此每个封装最多可容纳256个核心[2] - 每个CCD的硅面积约为165平方毫米,每个Zen 6核心加上4MB的L3缓存大约占5平方毫米[2] - 每个I/O芯片的面积约为353平方毫米,两个I/O芯片总面积超过700平方毫米,比之前EPYC CPU的I/O芯片面积(约400平方毫米)有显著提升[2] - 封装两侧各有4个小芯片,共8个,它们可能是结构硅片或深沟槽电容芯片,旨在改善CCD和I/O芯片的供电[2] - Venice采用2nm工艺技术制造,包含多达256个Zen 6核心[16] MI400系列加速器的架构与规格 - MI400加速器封装尺寸巨大,包含12颗HBM4显存芯片和“12颗2纳米和3纳米制程的计算和I/O芯片”[4] - 它似乎和MI350一样有两个基础芯片,但基础芯片顶部和底部似乎还有两个额外的芯片,很可能用于封装外I/O,例如PCIe、UALink等[4] - 两个基础芯片的面积约为747平方毫米,而封装外的I/O芯片的面积约为220平方毫米[4] - 很可能共有8个计算芯片,每个基础芯片上集成4个,计算芯片组的面积可能在140平方毫米到160平方毫米之间[4] - 将于2026年推出的Instinct MI455X GPU插槽拥有3200亿个晶体管,比MI355X增加了70%,采用2纳米和3纳米工艺,并配备432GB的HBM4堆叠式显存[14] - MI455X的性能比MI355X高出十倍[16] Helios AI机架系统 - 公司即将推出的下一代机架式服务器平台Helios,是为Yotta级计算时代而设计的[10] - 它采用双宽设计,基于开放计算项目(OCP)的开放式机架宽(ORW)标准,重量接近7000磅[10] - Helios将于2026年上市,搭载最新的AI GPU Instinct MI455X和下一代Epyc “Venice”服务器CPU[10] - 每个液冷托架包含四个MI455X GPU、Venice CPU以及Pensando Vulcano和Salina网络芯片[16] - 每个Helios机架拥有超过18,000个CDNA5 GPU计算单元和超过4,600个Zen 6 CPU核心,可提供高达2.9 exaflops的性能[18] - 每个机架包含31 TB的HBM4内存、260 TB/s纵向扩展带宽以及43 TB/s的聚合横向扩展带宽[18] - 数万个Helios机架可以扩展到整个数据中心[18] 公司战略与市场定位 - 在人工智能时代,公司正寻求在由行业领头羊英伟达主导的GPU系统市场中为自己开辟更大的空间[7] - 公司正努力将其Instinct GPU打造成英伟达的有力竞争对手[7] - 公司最近宣布与OpenAI建立合作关系,此前还与Oracle等其他AI领域的公司建立了合作[7] - 公司CEO指出人工智能领域对计算能力的需求每年增长超过四倍,并强调公司是最有能力提供这种计算能力的公司,能够提供GPU、CPU、NPU和系统架构[8] - 公司CEO强调构建兆级人工智能基础设施需要领先的计算能力、开放式模块化机架设计、高速网络连接以及易于部署[8] - 公司正在向英伟达发起挑战,其产品路线图表明它将继续这样做[18] 未来产品路线图 - 公司公布了未来两年的数据中心GPU路线图,首先是将于2026年推出的Instinct MI455X[14] - 2027年,公司将发布基于下一代CDNA 6架构的MI500系列GPU,采用2纳米制程工艺和HBM4E内存[16] - 这意味着公司在四年内(从MI300系列到MI500系列)实现了AI性能1000倍的提升[16]
今年CES,芯片厂商又开始“神仙打架”
36氪· 2026-01-07 08:42
文章核心观点 - 本届CES展会是芯片产业的技术风向标,展示了三大核心趋势:AI已渗透技术金字塔的每一层,物理AI和边缘AI是两大竞争关键;汽车电子步入“集中化+软件定义”深水区,跨域融合成为行业必然趋势;生态竞争取代单点技术比拼,协同合作联合定义产品成为制胜关键 [33] 德州仪器 (TI) - 发布三款汽车新品:L3跨域融合SoC TDA5系列、单芯片8发8收雷达发射器AWR2188、全新10BASE-T1S以太网串行外设接口PHY DP83TD555J-Q1 [1] - TDA5系列SoC算力极为强大,最高达1200TOPS,能效比超24 TOPS/W,AI算力较前代产品最高可提升12倍,采用UCIe接口增强扩展性,并与新思科技合作推出虚拟开发套件 [1] - AWR2188是业界首个单芯片8发8收雷达方案,性能较现有解决方案提升30%,能对距离>350米的目标实现高精度探测 [4] - DP83TD555J-Q1是首款10BASE-T1S产品,具有纳秒级时间同步能力,支持数据线供电,可降低线缆设计复杂度和成本 [7] 亚德诺半导体 (ADI) - 在汽车、消费、机器人三大领域展示方案 [10] - 汽车领域展示最新A²B 2.0方案,带宽比1.0版本高4倍,并展示利用E²B和LED驱动器的车灯方案、GMSL技术、无线BMS方案等 [10] - 消费领域与IDUN Technologies合作开发AI直接响应人体大脑与身体信号的演示,并在AR眼镜展示并联电池管理方案 [10] - 机器人领域展示视觉赋能的自主机器人仿生手、高精度轮驱运动控制方案、3D深度感知、以及为独轮机器人展示的六自由度IMU [11] 恩智浦 (NXP) - 发布S32N7超高集成度处理器系列,采用5nm技术平台,包含32个兼容型号,可在一颗芯片上实现动力总成、车辆动态控制、车身、网关和安全域 [12] - 该处理器通过减少数十个硬件模块,帮助汽车制造商大幅简化车辆架构,总体拥有成本最高可减少20% [12] - 算力包括8个分锁Cortex-A78AE@1.8 GHz、12个分锁Cortex-R52@1.4 GHz、eIQ NPU等,存储支持LPDDR4X/5/5X、36MB SRAM等 [15] 微芯科技 (Microchip) - 展示大量Demo,重点包括适用于高通Ride平台的ASA Motion Link方案,以及基于10BASE-T1S的无软件式智能大灯 [17] - ASA-ML方案展示四颗ADAS摄像头通过该技术无缝连接至高通Snapdragon Ride平台 [17] - 10BASE-T1S无软件大灯搭载欧司朗25K像素ULED,由端点直接渲染视频流,降低了中央计算机复杂度并构建了硬件抽象层 [18] 芯科科技 (Silicon Labs) - 推出适用于Zephyr的新Simplicity SDK,这是一种经过严格审核的Zephyr代码库快照,可完全访问公司标准技术支持渠道 [19] - 展演了蓝牙信道探测和使用人工智能/机器学习进行的单芯片无线电机控制 [19] 英飞凌 (Infineon) - 联合Flex展示一款为区域控制单元设计的模块化开发套件,旨在加速面向软件定义汽车的电子/电气架构开发 [20] - 该套件支持所有核心区域控制功能,预验证硬件集成了英飞凌的AURIX微控制器、OPTIREG电源、PROFET等产品,软件栈得益于Vector的贡献 [20] 意法半导体 (ST) - 与帕加尼和Osdyne合作推出Osdyne Automotive Gateway,利用了ST的Stellar SR6 G系列MCU,实现了车内和车到X的通信路由与防火墙、诊断、遥测、远程监控及空中更新等功能 [22] - 该网关旨在集中计算,以大幅减少线束数量,同时提供更多功能和更好性能 [22] - 也展示了在人形机器人方面的应用合作 [24] 安霸 (Ambarella) - 发布CV7端侧AI视觉感知SoC,采用4nm制程,专为多元AI感知场景深度优化,应用包括8K消费级智能产品、安防监控、机器人、工业自动化及视频会议系统 [25] - 相较于上一代产品,CV7在同等负载下的功耗降低20%以上,AI性能较上一代CV5 SoC提升超过2.5倍,并支持卷积神经网络与Transformer网络协同运行 [25] 英伟达 (NVIDIA) - 发布大量革命性产品,包括首次亮相的Rubin平台,该平台包含Vera CPU、Rubin GPU等六款新芯片 [26] - 汽车方面推出NVIDIA Alpamayo系列开源AI模型、仿真工具及数据集,以及完全开源的端到端仿真框架AlpaSim和超过1700小时驾驶数据的物理AI开放数据集 [26] - 机器人方面推出Jetson T4000平台,提供高达1200 FP4 TFLOPs的AI计算和64 GB内存 [26] 英特尔 (Intel) - 第三代英特尔酷睿Ultra处理器正式发售,成为首款基于Intel 18A制程节点的产品 [27][28] - Intel 18A采用RibbonFET和PowerVia技术,可在相同功耗下提升芯片性能超过15%,或在相同性能下降低功耗25%以上,晶体管密度提升30% [28] - 集成Arc GPU的全新酷睿Ultra X9在1080p高画质下,45款游戏的平均帧率对比前代平台提升高达77% [28] 超威半导体 (AMD) - 发布多款重磅新品,包括全新AI芯片MI455X GPU、Ryzen AI 400系列处理器、AMD Ryzen AI Max+系列处理器以及AMD AI开发平台Ryzen AI Halo [29] - MI455X拥有3200亿晶体管和432GB HBM4内存 [29] - 首批Ryzen AI 400 PC计划本月晚些面市,全年计划推出超过120款设计,Ryzen AI Halo平台预计第二季度上市 [29] - 公司强调是唯一拥有GPU、CPU、NPU全栈计算引擎的公司,过去四年已将AI性能提升1000倍 [30] Arm - 特别关注物理AI、边缘AI发展,认为其智能化演进与深度融合将成为AI领域发展的核心动能 [31] - 携手合作伙伴围绕五大应用场景展示前沿趋势:自动驾驶、机器人、PC/笔记本电脑/平板、可穿戴设备、智能家居 [31] - 预计到2026年,各大主流OEM计划推出的相关PC等机型将超过100款 [32]
OpenAI、李飞飞同台,Lisa Su:AMD AI 芯片走到关键一步
36氪· 2026-01-07 08:42
公司战略与产品发布 - AMD在CES 2026上发布了面向Yotta级AI时代的完整工业级平台,包括面向数据中心的MI455X GPU(3200亿晶体管)、面向企业部署的MI440X以及主推的机架级平台Helios [1] - 公司预告下一代MI500系列将在2027年登场,并宣称四年内性能增长1000倍 [3] - 公司战略从提供单一芯片转变为构建可规模部署、长期在线、灵活适配的AI基础设施,其Helios平台重达3吨,是一个集成的计算工厂 [7][9][10] 核心产品:Helios平台详解 - Helios平台采用高度集成设计,每个计算托盘包含4块MI455X GPU(3200亿晶体管,432GB HBM4内存)、1颗Venice CPU(多达256个Zen6核心)和1颗Pensando网络芯片 [11] - 平台具有模块化特点,采用OCP开放计算标准,组件可替换、升级和扩展 [13] - 平台强调效率,采用全液冷设计,每个机架拥有31TB显存,机架内部带宽达260TB/s,对外连接带宽43TB/s,运算能力达每秒2.9 Exaflops [15][16][17] - 与竞争对手NVIDIA的DGX系列相比,Helios更注重模块化、开放性和作为行业通用标准件的定位 [18] 行业趋势与算力需求 - AI算力需求急剧增长,从2022年的1 Zettaflop预计增长至2025年的超过100 Zettaflops,未来五年全球算力需再提升100倍,迈向10 Yottaflops [4] - 一个Yottaflop是1后面带24个零,是当前全球算力的上万倍,此量级的增长需要在五年内完成 [5] - 算力需求驱动因素包括:生成视频(一个10秒视频动辄十万个token)、多模态智能体以及企业本地AI部署 [6] - OpenAI总裁Greg Brockman指出,推理量在两年内激增了100倍,AI应用正从“尝鲜”变为“常驻”,对算力系统的长期稳定性和经济性提出更高要求 [6][21] 客户案例与生态验证 - 多家行业领军企业现场展示其核心业务部署于AMD平台,包括OpenAI、Meta、Luma、Liquid AI、Absci等 [2][19] - AI视频公司Luma已将60%的推理负载迁移到AMD平台,其10秒视频模型推理需处理高达10万个token [22] - MIT孵化的Liquid AI展示了在本地设备上运行的LFM 2.5(12亿参数)和LFM 3(多模态助手,延迟低于100毫秒)模型,凸显对部署速度、离线能力和功耗控制的需求 [24][27] - World Labs CEO李飞飞展示了空间智能应用,需要高带宽、低延迟、大内存和高并发能力,这超出了传统图形处理的范围 [29][30] 从云到端的全面布局 - 在云端,Helios机架、MI455 GPU和Venice CPU构成大规模训练与推理基础设施 [43] - 在企业级,MI440X和MI430X面向主权AI和超级计算场景 [43] - 在开发层,推出Ryzen AI Max(配备128GB统一内存,可本地运行200B参数模型)和手掌大小的Halo AI开发机,让开发者能离线进行模型开发 [36][37] - 在消费端,Ryzen AI 400系列处理器让普通PC也能运行Copilot等AI工具 [43] - 公司提供从云到边缘的连续计算结构,例如为人形机器人Gene One提供从本体嵌入式芯片到训练显卡的完整算力路径 [40][41] 垂直行业应用落地 - 医疗成为AI落地最快领域之一:Absci使用AMD MI355单日筛选超过100万种候选药物;Illumina使用AMD EPYC CPU和FPGA实时处理每日超过YouTube数据量的测序数据;AstraZeneca使用生成式AI使候选药物交付速度提升50% [38] - 工业机器人需要边缘AI进行本地实时决策与响应 [40][41] - 新兴场景如空间智能、机器人导航、虚拟世界构建对算力提出“不能等、不能断、不能慢”的要求 [42]