E-commerce and Technology Services

搜索文档
瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊
量子位· 2025-05-21 12:01
京东大模型研究成果 - 公司研究成果登上Nature旗下期刊npj Artificial Intelligence,提出开放环境下大模型训练与更新的系统方法[1] - 通过模型蒸馏、数据治理、训练优化与云边协同四大创新,平均提升推理效率30%,降低训练成本70%[1][8] - 是国内首个系统性解决大模型开发效率难题并获国际顶刊认证的研究[2] 技术突破与创新方法 - **模型蒸馏**:采用动态分层蒸馏技术,仅调整0.5%参数实现高效训练,支持京东大模型/Llama/DeepSeek等多模型蒸馏[5][6] - 蒸馏后京东大模型Livebench性能提升14分,同量级模型效果显著优化[7] - **数据治理**:跨领域动态采样算法结合隐私保护技术,提升模型泛化能力[11] - **训练优化**:贝叶斯优化框架处理离散空间,MPMD场景资源利用率提升40%[11] - **云边协同**:云端训练+边缘推理,两阶段压缩策略适应资源限制[11] 商业化应用与平台能力 - JoyBuild平台提供定制化解决方案,内置20余种开源模型、100余种算法工具链,支持通用模型快速专业化[9][10] - 企业模型开发周期从10余人团队缩减至1-2人,全流程耗时从数周缩短至1周,推理成本节约90%[10] - 平台沉淀京东零售/物流/健康/金融等行业Know-How,应用于供应链优化、智能客服等场景[12] 行业影响与未来方向 - 技术方案为行业提供通用路径,非"黑箱"式解法,推动AI规模化落地[12] - 未来将持续提升大模型开发效率,降低企业AI应用构建成本[12]