AI超级计算平台
搜索文档
混合计算成为常态,这个平台急需建设
中金在线· 2025-10-24 14:21
行业趋势与核心观点 - Gartner将AI超级计算平台列为2026年首要战略技术趋势,该平台整合CPU、GPU、AI ASIC等多种计算范式以统筹复杂工作负载[1] - 到2028年,超过40%的领先企业将采用混合计算范式,较当前8%的水平实现跨越式增长[1] - 算力供给模式正发生根本性重构,混合算力因海外供应链风险从“可选项”变为“必选项”,被视为企业AI战略的生存问题[1] 混合算力面临的挑战 - 算力架构需从以CPU为中心转向以GPU为中心以支持AI原生应用,同时需加速GPU国产化替代以满足金融、政务等领域的合规要求[1] - 在未经优化的混合环境中,算力利用率普遍低于40%,存在资源浪费严重的局面[2] - 从实验到生产系统的规模化过程中,混合架构的复杂性呈指数级增长,超出大多数企业技术团队的掌控范围[2] 京东云JoyScale平台解决方案 - 京东云JoyScale AI算力平台定位为“算力操作系统”,旨在打通全链路的混合算力服务新范式[3] - 平台智能调度核心全面适配十余家国产算力,兼容昇腾、寒武纪、海光等国产加速卡,整体资源利用率提升70%,推理性能提升50%[5] - 平台具备生态兼容能力,通过与国产芯片厂商深度合作,从内核层屏蔽异构硬件复杂性,实现更高效的AI算力[5] - 平台通过信通院最高等级双认证,全栈软件平台自主研发,满足金融级数据安全、性能和稳定性要求[6] 市场应用与客户案例 - 算力基础设施竞争正从“规模竞赛”转向“体系化竞争”,企业需兼顾短期利用率与成本问题及长期架构敏捷性[7] - 京东云JoyScale凭借内核级算力池化、全栈自研可控等优势,已获数十家头部国央企采用以构建新一代AI算力平台[7] - 某知名证券公司案例显示,部署JoyScale后,通过将5个业务系统的GPU资源池化,AI算力分时复用实现多团队共享,推理任务资源满足率从65%提升至98%,国产芯片使用占比稳步提升[7] - 京东云基于集团复杂场景实践,已构建从智算基础设施到上层Agent应用开发的一站式大模型产品矩阵,支持国央企快速部署AI应用[7]
Gartner《2026年重点关注的十大战略技术趋势》(下载)
欧米伽未来研究所2025· 2025-10-21 17:14
AI超级计算平台 - AI超级计算平台整合CPU、GPU、AI ASIC、神经系统计算和替代性计算范式,以统筹复杂工作负载并释放更大的性能、效率与创新潜力[5] - 这些系统融合强大处理器、海量存储、专用硬件及编排软件,可处理机器学习、仿真模拟和分析等领域的数据密集型工作负载[5] - 到2028年,将混合计算范式架构应用于关键业务流程的领先企业将达到40%以上,较当前8%的水平大幅增长[6] - 该技术已在推动各行业创新,例如医疗和生物技术企业将新药建模时间从数年缩短至数周,金融服务机构通过模拟全球市场降低投资组合风险[7] 多智能体系统 - 多智能体系统是由多个AI智能体组成的集合,它们通过交互实现复杂的个体或共同目标,可在单一或分布式环境中独立开发部署[7] - 通过使用多智能体系统,企业可实现复杂业务流程自动化、提升团队技能并开创人类与AI智能体的新协作方式[9] - 采用模块化设计的专业智能体通过在各工作流中重复使用成熟解决方案提升效率、加快交付速度和降低风险,便于扩展运营规模和快速适应需求变化[9] 特定领域语言模型 - 特定领域语言模型是在针对特定行业、功能或流程的专用数据上训练或微调的语言模型,凭借更高准确性、更低成本和更好合规性填补通用大语言模型的空白[11] - 到2028年,企业使用的生成式AI模型中将有超过半数属于特定领域模型[12] - 基于DSLM的AI代理可解读特定行业上下文,即使在陌生场景中也能做出合理决策,具有出色准确性、可解释性和决策合理性[13] AI安全平台 - AI安全平台为第三方及定制AI应用提供统一防护机制,能够进行集中监测、强制执行使用策略并有效防范AI特有风险,如提示注入、数据泄露、恶意代理行为等[13] - 到2028年,使用AI安全平台保护AI投资的企业比例将达到50%以上[15] AI原生开发平台 - AI原生开发平台使用GenAI实现快速、便捷的软件开发,使软件工程师作为"前沿部署工程师"协同领域专家开发应用[15] - 到2030年,80%的企业将通过AI原生开发平台将大型软件工程团队转变为更小、更敏捷的团队并通过AI赋能这些团队[17] - 领先企业正在组建微型平台团队,在安全和治理框架范围内让非技术领域专家能够自主开发软件[15] 机密计算 - 机密计算重塑企业处理敏感数据的方式,工作负载被隔离在基于硬件的可信执行环境中,即使面对基础设施所有者、云提供商或任何拥有硬件物理访问权限的实体也能保持内容与工作负载私密性[18] - 到2029年,75%以上在非可信基础设施中处理的业务将通过机密计算保障使用安全[18] 物理AI - 物理AI通过赋能具有感知、决策和行动能力的机器与设备,将智能带入到现实世界,为自动化、适应性和安全性至关重要的行业带来可观收益[19] - 随着技术日益普及,企业需要融合IT、运营与工程知识的新型技术人才,这一转变带来技能提升与协作机会,但也可能引发就业担忧[21] 前置式主动网络安全 - 前置式主动网络安全运用AI驱动的安全运营、程序化阻断与欺骗技术在攻击者行动前实施干预,通过预测实现防护[23] - 到2030年,随着企业从被动防御转向主动防护,前置式主动防御解决方案将占到企业安全支出总额的一半[23] 数字溯源验证 - 数字溯源指对软件、数据、媒体及流程的来源、所有权和完整性进行验证的能力,企业可使用软件物料清单、认证数据库、数字水印等工具验证和追踪供应链中的数字资产[23] - 到2029年,在数字溯源方面投入不足的企业将面临高达数十亿美元的制裁风险[23] 地缘回迁 - 地缘回迁指企业因考虑地缘政治风险而将数据与应用从全球公有云迁出至主权云、区域云服务商或自有数据中心等本地平台[24] - 到2030年,欧洲和中东地区将有超过75%的企业把虚拟工作负载回迁至降低地缘政治风险的解决方案,而2025年的这一比例不足5%[26] - 将工作负载转移至主权立场更强的服务提供商可帮助加强对数据驻留、合规及治理的控制力,提高对本地法规遵从性并获得关注数据隐私或国家利益客户的信任[26]