文章核心观点 - 共封装光学器件是解决人工智能数据中心功耗和带宽瓶颈的关键技术,通过将光子引擎与计算芯片集成在同一封装内,可显著降低每比特传输能耗并提高带宽,从而应对AI发展带来的巨大电力与数据挑战[2][3][4] CPO技术原理与优势 - CPO将光子引擎直接集成到与ASIC、GPU或CPU相同的封装基板或模块内,使电信号传输距离缩短至几毫米,替代了传统需要15到30厘米PCB传输的方案[2] - 该技术的核心优势在于提供极低的每比特传输能耗,这是衡量数据中心效率的关键指标,尽管CPO本身并非低功耗技术[2][4] - CPO通过消除对长距离低效电线的需求,并减少对大量高速电I/O引脚的需求,从而释放封装资源用于供电,支持背面供电等先进技术[12][25] 市场驱动与行业参与方 - 到2030年,满足全球人工智能需求预计需要5.2万亿美元的数据中心投资,解决电力和带宽挑战对投资回报至关重要[3] - 在CPO技术开发中处于领先地位的公司包括博通、英伟达、英特尔、Marvell和Ayar Labs[3] - 技术由GlobalFoundries、IBM、英特尔晶圆代工、Tower Semi和台积电等代工厂支持,同时EDA工具供应商如Cadence、Keysight EDA、西门子EDA和Synopsys也推出了CPO设计工具[3][19][20] CPO设计挑战与解决方案 - 功耗管理:为AI数据中心设计的计算节点芯片功耗极高,一个两英寸见方的芯片可消耗近35,000安培电流,功耗高达35千瓦,管理高功耗是先进封装设计的重大挑战[6] - 热光协同设计:光子元件对温度高度敏感,温度变化会导致光学器件出现波长漂移,设计需进行复杂的多物理场仿真以控制热流[14] - 供电挑战:为光子集成电路中的环形谐振器供电是挑战,每个环路可能消耗1到10毫瓦,未来设计可能集成数千个环路,供电需求随之增长[7] - 系统集成:CPO需要管理单个封装中光和电的物理与功能融合,涉及异构芯片集成、消除信号瓶颈、硅光子学发展及激光源管理等[14] 技术实施与产业链进展 - CPO采用3D芯片配置,将光子器件安装在基板上,微型SerDes堆叠其上,通过TSV传输信号,光纤直接连接封装内的光子器件[9] - 该技术可节省高达30%的系统总功耗,并通过在光纤内设置8到16个通道,在低功耗下提供卓越带宽[12][14] - 大型EDA公司正积极布局:Cadence与Lightmatter及Tower Semiconductor合作开发集成流程;Keysight EDA收购Synopsys光学业务并发布验证工具;西门子EDA收购Canopus AI并扩大与英伟达合作;Synopsys与Lightmatter、台积电及英伟达合作优化接口与仿真[19][20] 未来发展方向与待解决问题 - 为使CPO更普及,需解决高级封装问题,包括GPU/ASIC附近的散热、实现更高精度光耦合、提高激光器可靠性、提高制造良率及降低制造成本[22] - 其他挑战包括促进CPO模块外形尺寸标准化、改进测试验证自动化及确保光引擎故障时的可维护性[22] - 从物理层面,光子集成电路波导的折射率对温度敏感,系统需被加热至约100度的稳定高温,并通过内置加热器及热管理来维持性能稳定[22] - 系统集成需确保多芯片复合光子器件所有元件在合适温度范围内工作且不过度耦合[23]
群雄争霸CPO