Workflow
AI架构
icon
搜索文档
英伟达下一代GPU,巨幅升级!
半导体芯闻· 2025-09-29 17:45
竞争态势与产品预期 - NVIDIA与AMD正竞相修改下一代AI架构设计以获取优势[1] - AMD高管对Instinct MI450产品线持乐观态度 称其将成为公司的"米兰时刻"[2] - MI450预计将比NVIDIA的Vera Rubin更具竞争力 下一代产品线将采用AMD技术栈[3] - 两家公司产品技术差距预计将缩小 因将采用相同技术如HBM4、台积电N3P节点和chiplet设计[6] 产品规格升级 - MI450X的TGP比初始值增加200W Rubin的TGP相应增加500W至2300W[5] - Rubin的内存带宽从每GPU 13 TB/s提升至每GPU 20 TB/s[5] - AMD Instinct MI450预计采用HBM4内存 每GPU容量最高432GB 内存带宽约19.6 TB/s[6] - NVIDIA Vera Rubin VR200预计采用HBM4内存 每GPU容量约288GB 内存带宽约20 TB/s[6] - MI450的密集计算性能约40 PFLOPS VR200的密集计算性能约50 PFLOPS[6] 技术创新与互连架构 - AMD计划在Zen 6上大幅提升D2D互连技术 Strix Halo APU已体现相关变化[7] - 传统SERDES PHY互连技术存在效率较低、能耗和延迟较高的问题[8][10] - Strix Halo采用台积电InFO-oS和RDL技术 通过宽并行端口进行芯片间通信[12] - 新方法无需序列化/反序列化 降低了功耗和延迟 提升了整体带宽[14] - 该互连创新预计将与Zen 6 CPU保持一致[14]
Imagination E系列发布:架构进步巨大,静待市场发挥
36氪· 2025-05-08 20:24
公司动态 - Imagination发布新一代GPU IP——Imagination E系列,采用新架构设计提升单位面积能效比35% [5][6] - 新架构名为"爆发处理器(Burst Processors)",通过缩短ALUs管线深度减小数据传输延迟并提高指令命中率 [6] - Imagination E系列基础架构更现代化,接近其他桌面GPU的"每一个流处理器都是一个完整ALU"构型 [10] 技术架构 - Imagination E系列将AI单元与传统图形计算单元(USC)合并,每个USC可随时切换为AI加速单元使用 [17] - 这种设计使AI单元和图形单元拥有完全一致的内存延迟性能,所有USC可根据需求动态配置功能 [20] - 相比市面其他GPU的AI单元设计,该架构避免了显存带宽抢占问题,降低功耗和硬件成本 [16][20] 性能参数 - 最小规格单核心单USC配置下,主频1GHz时提供8GPixel/s像素绘制性能、0.25TFLOPS浮点算力或2TOPS神经网络性能 [21] - 最大规格四核心阵列(每核心8USC)在1.6GHz频率下实现400Gpixel/s像素绘制、12.8TFLOPS浮点算力或200TOPS神经网络性能 [24] - 预估桌面端2400MHz主频时最大浮点性能达19.2TFLOPS,超过英伟达RTX5060 [26] 市场定位 - 移动端单核心最大算力约3.2TFLOPS,与高通骁龙8至尊版Adreno 830(3.379TFLOPS)接近 [24][26] - 国内GPU企业如摩尔线程、象帝先、芯动科技已采用Imagination技术支撑自主GPU研发 [26] - Imagination强调自身为IP提供商而非软件厂商,需授权方协同挖掘架构潜力及扩展应用 [29]