Workflow
真武系列AI芯片
icon
搜索文档
磐脉920亮相,平头哥算存网版图闭环
雷峰网· 2026-04-29 21:24
文章核心观点 - 行业共识正从追求单点算力性能转向关注整个算力网络系统的协同能力,网络已成为制约大规模AI集群效率的关键短板[2] - 平头哥通过发布磐脉920智能网卡,完成了对数据中心算力、网力、存力三大关键环节的芯片全布局,具备了构建完整算力基础设施的底层能力[4][21] - 同时掌握算、存、网三类核心芯片能力的厂商,将有机会重新定义AI基础设施的性能边界与成本结构[22] AI集群的网络瓶颈与行业趋势 - 在网络结构未优化的情况下,大规模AI集群的GPU利用率通常仅维持在30%—40%区间,优化较好也很难超过60%[2][10] - 集群规模扩大进一步放大了网络瓶颈,突发推理流量、复杂拓扑链路拥塞、长数据路径等问题侵蚀算力效率[2] - AI系统负载结构正从训练与推理1:1的比例向4:1演进,网络需承载高频、突发、混合型推理流量,对带宽和时延提出持续挑战[6] - 现有网络体系存在代际差异,传统TCP网卡依赖CPU,RDMA在大规模集群中仍受多层交换拓扑、跨节点同步等因素制约[7] 磐脉920智能网卡的技术与性能 - 磐脉920是AI原生智能网卡,采用PCIe 5.0与112G PAM4以太网技术,最大支持400Gbps吞吐带宽,收发包率达400Mpps[3] - 该网卡每秒可处理4亿个网络数据包,单秒传输能力相当于100部高清视频数据量[13] - 通过多路径RDMA机制、细粒度网络感知与可编程拥塞控制算法,将链路带宽利用率从约60%提升至接近90%[14] - 在网卡内部引入PCIe Switch,直连GPU与SSD,构建更短数据传输链路,降低系统复杂度[15] - 其“内生式网络结构”设计带来了整体系统成本约30%的下降[16] 磐脉920的产品策略与市场定位 - 磐脉920已进入量产阶段,首批产品已上线,订单正在加速交付[4] - 它并非定制化专用网卡,而是一款面向开放市场的通用型产品[19] - 产品将首先在阿里云数据中心部署,并已向外部服务器厂商、部件厂商及多类云厂商开放测试[20][21] - 设计围绕多类算力基础设施需求展开,适配智算集群、通算集群、存储场景及数据库与大数据分析等多种场景[18] 平头哥的芯片布局与战略意义 - 随着磐脉920发布,平头哥已完成数据中心四大核心芯片布局:真武系列AI芯片、倚天系列CPU、磐脉系列智能网卡、镇岳系列存储主控芯片[4] - 这覆盖了算力、网络与存力三大关键环节,意味着公司已具备从提供单一算力器件走向构建完整算力基础设施能力的底层条件[21]