Workflow
阿里云企业级实例g9ae
icon
搜索文档
从计算到存储,阿里云打通AI落地的“任督二脉”
AI前线· 2025-09-05 13:33
文章核心观点 - AI时代云基础设施的竞争焦点已从硬件堆砌转向架构精妙度、业务场景贴合度以及破解规模效应减弱魔咒的能力 [2] - 阿里云通过发布通用计算、容器计算及存储服务三项产品更新,串联出一条AI落地业务场景的完整路径,引导行业重新思考云基础设施的本质 [2] - 未来竞争将回归业务创新本身,当资源不再成为瓶颈,场景抽象能力和模型迭代速度成为胜出关键 [31] 计算实例产品更新 - 发布三款基于AMD第五代EPYC处理器(Turin)的企业级实例:u2a、g9a、g9ae,针对不同业务场景提供差异化性能 [5] - u2a实例面向中小企业,性能基线较u1提升20%,支持最高15%算力突发,网络带宽支持从16Gbps突发至25Gbps,性价比提升50% [7] - g9ae实例采用物理核设计,每个vCPU独占L3缓存和内存通道,单vCPU算力提升高达60%,视频转码性能提升65% [8][9] - 通过软硬件深度融合,阿里云自研操作系统与AMD Turin服务器进行基因级适配,MySQL查询速度提升10%,单节点推理性能提升15% [10] 容器服务升级 - 阿里云容器服务ACK新增云原生AI套件Serving Stack,包含RoleBasedGroup控制器和Gateway Inference Extension两大组件 [18][19] - RBG控制器在Deepseek R1推理服务测试中,模型加载耗时减少90%,实现10GiB/s以上带宽 [21] - GIE组件在模型推理压测中,长尾场景首包延迟提升73%,缓存利用率提升90%,响应速度提升40% [21] - 容器计算服务ACS实现五大技术突破,包括CPU与内存最小粒度0.5vCPU、支持分钟级万个Pod弹出、新增价格仅为常规实例20%的BestEffort模式 [27] 存储服务增强 - 表格存储Tablestore升级AI场景支持能力,通过DiskANN等向量检索算法和自动弹性伸缩,较传统自建方案降低30%整体存储成本 [28] - 推出开源AI Agent Memory框架,预置会话、消息、知识库三大通用数据模型,支持通过OpenMemory MCP一键部署AI记忆方案 [34] - 功能升级包括新增JSON格式支持、多列向量功能,降低数据冗余并加速关联查询 [34] 行业影响与趋势 - 云计算本质从算力资源转向服务属性,未来算力与存储将继续服务化,企业只需为业务峰值买单 [30] - 基础设施设计理念转变为让基础设施匹配业务,而非业务迁就基础设施,实现算力按需膨胀、按秒计费、按故障自愈 [30] - Kubernetes已成为AI/ML工作负载主流平台,52%终端用户在Kubernetes上运行AI/ML工作负载 [14]