这项互联技术,要超越CPO!

公众号记得加星标⭐️,第一时间看推送不会错过。 训练大型新型AI模型的速度,归根结底取决于两个词:向上(up)与向外(out)。 在数据中心领域,横向扩展(scaling out)指增加可互联的AI计算机数量,将大型任务拆分处理;而 纵向扩展(scaling up)则是在每台计算机中集成尽可能多的图形处理器(GPU),通过互联使其等 效于一个巨型GPU,从而更快地处理更大规模的任务模块。 这两种扩展方式依赖不同的物理连接技术。横向扩展主要依靠光子芯片和光纤,二者结合可实现数百 米甚至数千米的数据传输;纵向扩展形成的网络密度约为横向扩展的10倍,其核心技术则更为简单经 济——通常是长度不超过1-2米的铜缆。 但高性能计算机所需的GPU间数据传输速率不断攀升,已逐渐逼近铜缆的物理极限。数据中心互联初 创企业Point2 Technology的产品营销与业务拓展副总裁戴维·郭(David Kuo)表示,当铜缆的带宽 需求接近太比特/秒级别时,物理规律决定了其必须做得更短、更粗。这带来了两大难题:一是当前 计算机机柜内部空间本就拥挤,二是头部AI硬件企业英伟达(Nvidia)计划到2027年将每系统最大 GPU数量从 ...