智能体原生云

搜索文档
打造全球首个强化学习云平台,九章云极是如何做到的?
机器之心· 2025-07-16 12:21
AI范式转变与强化学习崛起 - AI正经历从被动响应的语言模型向具备自主决策能力的智能体转变,进入"经验时代"或"软件3.0时代"[1] - 强化学习(RL)成为实现AGI的关键技术,被诺贝尔奖得主Demis Hassabis和图灵奖得主Richard Sutton视为哺乳动物智能的基础[2] - 强化学习面临高频数据交互、动态算力需求等挑战,传统云计算平台难以适配其动态多阶段特性[2] 九章云极AgentiCTRL平台突破 - 公司发布全球首个工业级强化学习云平台AgentiCTRL,支持万卡级异构算力调度[3] - 基于MoE架构实现端到端训练效率提升500%,综合成本下降60%[4] - 平台采用Serverless架构实现弹性资源调度,GPU利用率提升25%,人工介入次数减少90%[16][19] - 在OSWorld基准测试中,训练后的Alaya-UI智能体任务完成率从6.87%跃升至24.8%[21] 技术架构创新 - 重构强化学习训练流程,用户仅需极少代码即可完成训推闭环[12] - 自研异构算力操作系统突破"秒级生成百万级token"性能瓶颈,GPU利用率超95%[31] - 实现全异步解耦、多环境异构引擎等核心技术,支持智能体即服务模式[10] - 环境模拟、策略执行等复杂机制深度封装,开发效率提升数倍[14] 智能基础设施战略 - 构建三层能力体系:软件定义AI基础设施、Alaya NeW OS操作系统、Alaya NeW Cloud工具链系统[29] - 提出"1度算力"普惠化标准,采用按使用量计价模式降低AI使用门槛[28][30] - 已在政务、金融等七大行业实现部署,强化学习云领域稳居第一梯队[31] - 成立AI-STAR生态联盟及1.8亿元生态基金,加速产业落地[33] 行业竞争与未来展望 - 公司通过系统级重构实现范式跃迁,而非简单算力堆叠[37] - 开发门槛降低使RL训练如调用API般简单,端到端性能提升5倍[38] - 定位为"智能体运行的操作系统级云平台",非传统工具链供应商[40] - 预计强化学习将从实验室特权转变为AI系统常规组件[41]