中科曙光高级副总裁李斌:算力基础设施的成熟标志是“开放”|2026商业新愿景

行业背景与核心矛盾 - 人工智能产业发展对算力提出苛刻要求,大模型参数量从亿级向万亿级跃升,导致计算量指数级增长 [3] - 国内算力产业长期存在结构性矛盾:需求侧急需大规模稳定算力,供给侧却呈现严重的碎片化特征 [4] - 各厂商硬件设计、软件栈和互连协议自成体系,形成封闭技术路线,导致算力资源难以跨平台调度,用户迁移成本高 [5] - 市场需要的是高效、安全、稳定的智能计算基础设施 [6] 战略方向与开放架构 - 公司于2025年明确提出“AI计算开放架构”战略,核心逻辑在于产业分工与协作 [7] - 战略主张建立开放的产业格局,使国产芯片、整机、软件和大模型等产业链上下游企业能够解耦协作 [8] - 基于开放架构设计的系统能够支持不同品牌的国产加速卡进行异构部署,并在软件层面兼容CUDA等主流计算生态 [9] - 该开放架构降低了开发者的使用门槛,让用户拥有更多选择权,不必被单一技术路线绑定 [9] - 公司将继续坚持“开放”的技术路线,认为只有基于开放架构和统一标准,才能有效联动产业链,构建具有国际竞争力的产业生态 [13] 核心产品与技术突破 - 国家超算互联网核心节点在郑州上线试运行,部署了3套由公司提供的scaleX万卡超集群,最大可对外提供超过3万张AI加速卡的算力 [2] - scaleX万卡超集群是“AI计算开放架构”战略落地的产物 [8] - 系统工程化落地攻克了软硬件协同优化、高密度集成、高效供电与散热、高速互连扩展、智能运维管理等技术难关 [8] - 采用超高密度刀片、浸没相变液冷等技术,将单机柜的算力密度提升了20倍,同时将PUE值(电源使用效率)降低到1.04 [8] - 通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,可将AI加速卡资源利用率提高55% [8] - 该系统已经实现了超过400个主流大模型和世界模型的适配优化 [9] 应用场景与价值体现 - 针对超大规模模型训练,万卡超集群可以支持万亿参数模型的整机训练与容错恢复 [10] - 面向高通量推理场景,超集群已服务于多家头部互联网用户的核心智能化业务,并通过联合深度优化持续提升推理效能 [11] - 在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,并助力国内顶级科研团队将蛋白质研究效率提升3—6个数量级 [11] - 搭配OneScience科学大模型一站式开发平台,超集群能够大幅降低多学科交叉研究的创新门槛 [12] - 算力设施建设的最终目的是服务于实体产业,其价值取决于能否融入产业作业流程并解决实际问题 [9] - 当算力、数据和应用场景真正结合时,技术才能转化为推动经济发展的动能 [13] 行业趋势与公司展望 - 郑州核心节点的上线试运行,验证了国产算力基础设施的工程化能力,行业已从早期的单点突破转向集群创新,并实现大规模的落地部署 [2] - 展望2026年,智能化浪潮将推动计算产业进入一个新的发展周期 [13] - 公司2026年将继续以务实的态度,推动国产智能计算基础设施向着开放、高效、安全的方向演进 [15] - 公司将重点关注核心部件、整机系统、软件生态及应用服务的全链条创新,致力于解决异构算力的适配难题,提升算力资源利用效率 [13] - 无论是面对万亿参数的大模型训练,还是科学计算的复杂场景,公司都将提供成熟、可靠的解决方案 [13]

中科曙光高级副总裁李斌:算力基础设施的成熟标志是“开放”|2026商业新愿景 - Reportify