京东云JoyBuilder升级,具身智能模型训练效率提升3.5倍
新浪财经·2025-12-08 11:14

京东云JoyBuilder平台升级 - 京东云JoyBuilder模型开发平台迎来全新升级,成功支撑业界顶尖模型GR00T N1.5的千卡训练 [1][3] - 该平台成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台 [1][3] - 平台训练效率较开源社区版本提升3.5倍 [1][3] 训练效率与性能突破 - 通过软硬件深度调优和算法突破,大幅提升模型训练效率与稳定性 [1][3] - 针对1亿以上数据量的千卡训练,时间从15小时缩短至22分钟 [1][3] - 此举加速了具身智能技术迈向规模化落地 [1][3] 全栈优化技术细节 - 在具身数据链路优化方面,重构数据预处理与加载流程,实现CPU数据处理与GPU计算异步执行,减少等待时间 [1][3] - 自研高性能并行文件系统云海JPFS,通过分布式元数据管理与智能预取支持高并发访问 [1] - 在1024卡集群上,读取带宽超过400GB/s,保障数据持续高速供给 [1] 模型计算与基础设施优化 - 在具身模型计算优化方面,针对主流开源VLA模型,从Attention层、Token裁剪和训练后量化等多方位进行极致优化 [2][4] - 通过搭建3.2T RDMA后端网络,并应用多轨道优化、拓扑感知调度与智能震荡抑制,保障千卡间集合通信的高吞吐与低延迟 [2][4] - 基础设施支持单点故障快速恢复,保障长周期训练稳定运行 [2][4] 平台综合能力与行业地位 - 基于云原生的AI数据湖优化了数据调度与流水线,提升端到端处理效率 [2][4] - 平台支持业界当前最主流的LeRobot训练数据最新协议 [2][4] - 基于全链路数据处理、模型计算效率和AI基础设施的全面优化,巩固了其行业领先地位 [2][4]