文章核心观点 - 高通技术公司在投资者日宣布了全面的数据中心路线图,推出全新的“高通蜻蜓”产品组合,旨在为代理式AI时代提供高性能、低功耗、低总拥有成本的全栈数据中心基础设施解决方案 [1] - 公司认为代理式AI正显著推高数据中心AI推理需求,其低功耗、高性能计算优势与市场向更高性能、更低功耗和成本的基础设施转型趋势高度契合 [2] - 高通通过将计算、AI、内存和连接性整合为统一的机架级平台,并引入创新的高通高带宽计算技术,以解决内存带宽和功耗等关键瓶颈,优化数据中心级、代理密集型AI推理工作负载 [3][6] 新产品组合发布 - 发布的新数据中心解决方案包括:高通蜻蜓C1000 CPU、高通高带宽计算、高通蜻蜓AI300推理加速器、领先的连接性产品以及定制芯片解决方案 [1][4] - 高通蜻蜓AI300作为第三代机架级AI推理平台,加入了此前已发布的AI200和AI250,形成了每年更新的多代AI加速器路线图 [1][4][9] - 高通高带宽计算是一项创新的近内存计算架构,旨在通过3D堆叠硅解决方案将计算与高度加速的内存带宽结合,以解决AI基本的数据移动瓶颈 [7] 高通蜻蜓C1000 CPU详情 - 这是一款为数据中心设计的专用CPU,针对代理式、通用和AI头节点工作负载,旨在实现领先的性能、利用率和最佳的能效与总拥有成本 [8] - 采用定制设计的高通Oryon CPU核心,优化了核心性能和频率(>5 GHz),并采用250+核心数的小芯片设计,以实现卓越的吞吐量和规模 [8] - 预计比现有服务器CPU竞品(基于规格)的每瓦性能提升超过2倍,并支持先进的可靠性、可用性和可维护性特性 [8] - 支持高达>2 TB/s的领先PCIe Gen 7连接性和CXL连接性,以支持下一代加速器、高速网络、存储和内存分解 [8] - 商业可用性预计在2028年 [8] 高通高带宽计算技术详情 - HBC拥有多代路线图,旨在以比高带宽内存更低的总拥有成本和更高能效,提供更快、更高效、可扩展性更强的处理能力 [11] - 采用HBC Gen 1的AI250设计可实现每卡133 TB/s的行业领先有效内存带宽,比采用LPDDR5X的AI200提升18倍;采用HBC Gen 2的AI300设计将实现比AI200提升54倍的进一步跃升 [11] - 与竞品公布的卡级规格相比,HBC设计旨在实现比HBM高6倍的每瓦带宽;与竞品公布的机架级规格相比,设计旨在实现比SRAM高200倍的每瓦容量 [11] - HBC Gen 1与AI250的商业样品预计在2027年中期提供 [11] 高通蜻蜓AI300详情 - AI300集成了突破性的高通HBC Gen 2技术,具有集成内存和更高的有效内存带宽,专为分解式推理部署设计 [11] - 预计在每卡内存带宽每瓦性能上,比现有基于GPU的架构提升4-8倍 [11] - 支持通过UALink和ESUN进行纵向扩展,通过铜缆和光缆进行横向扩展 [11] - 商业样品预计在2028年提供 [11] 定制芯片与连接性解决方案 - 提供针对下一代AI和云数据中心基础设施的大规模性能优化芯片,以及为代理式AI等专业工作负载的定制芯片 [11] - 连接产品组合涵盖芯片到芯片、铜缆、光缆和园区范围互连,支持800G和1.6T高带宽连接,传输距离可达20公里 [19] - 结合了公司的SerDes、PAM4、相干精简DSP、信号完整性和遥测能力,以支持可扩展的高性能AI基础设施 [19] 行业合作与生态支持 - 高通技术与Meta宣布达成战略性的多代合作,高通将成为Meta数据中心CPU的供应商,高通蜻蜓C1000 CPU计划为Meta的下一代服务器群提供动力 [12][13] - 此外,来自技术和AI生态系统的超过35家全球领先企业表示支持高通技术的数据中心愿景和商业解决方案 [14] - 公司致力于以每年为节奏推进多代数据中心路线图,专注于提升AI推理性能、能效和总拥有成本 [15]
Qualcomm Unveils Comprehensive Data Center Roadmap for the Agentic AI Era with New Qualcomm Dragonfly Portfolio