智能研发的点与面：蚂蚁代码大模型落地实践

报告行业投资评级未提及报告的核心观点报告围绕蚂蚁智能研发展开，介绍CodeFuse在研发全生命周期提效探索、蚂蚁大模型发展路线、智能研发发展路线，分析算法和工程关键技术与难点，还对未来软件研发领域发展方向进行思考 [4][10][23] 根据相关目录分别进行总结研发提效探索 - CodeFuse探索在蚂蚁研发全生命周期提效，涉及代码大模型探索，开发者在编写代码、调试代码等活动耗时多，代码补全、代码问答等功能使用占比受关注 [4][8][9] - 蚂蚁大模型发展历经多阶段，从2022年GPT - 3模型落地（0.25B模型、代码行补全）到2024年CodeFuse持续升级（BigCode第一名、仓库级代码问答等） [10][11][17] - 大模型能力演进包括集成平台知识库加训、结合平台能力智能化改造、通过SOP编排多领域Agent完成任务；效能平台产品从工具化向智能化、AI Native演进 [18][20] - CodeFuse代码大模型落地覆盖需求分析、编码自测、联调测试等环节，具备需求智能拆解、代码补全、测试用例生成等核心能力 [21] 智能研发发展路线 - 智能研发有Copilot + Chat、Copilot + Agent、AI Native三种模式Copilot + Chat是传统效能平台集成AI能力，在生成式、总结类、推理类场景智能化升级；Copilot + Agent是传统效能平台与AI能力深入结合，以领域Agent为核心升级；AI Native是AI能力友好嵌入用户操作 [25][26][28] 关键技术与难点 - 算法关键技术与难点：代码补全模型面临代码底座大模型到产品落地挑战，如代码能力、自回归训练、语法、感知范围、推理部署等问题，对应解决方案有预训练 + MFT微调、FIM、BlockFim、RepoFuse、ModelOps加速 [32][33] - 工程关键技术与难点：算法模型到产品落地存在触发时机、上下文边界、实时 + 耗时、效果优化、多模型/多策略等挑战，解决方法有触发时机优化、RAG + 程序分析、本地存储/索引、PE/前后处理、AB平台等 [34][35] - 解决模型幻觉问题：基于上下文感知学习（ICL）能力，通过预处理构建本地索引、结合RAG + 程序分析强化上下文、扩展感知边界，可提升测试集EM值，解决单文件补全不准问题 [41][45][47] - 解决代码生成不完整问题：基于Block - FIM能力，结合程序分析技术构建Block数据，解决大模型自回归训练不适合代码补全、FIM字符粒度切分样本语法不准确问题 [53][54][55] 未来方案思考 - 人工智能应用阶段分Intelligence、Agent、Copilot、Chat Bot、TOOL，体现人类与AI在工作中的不同协作程度 [58][59] - AI程序员（Multi - Agent技术路线）由调度Agent、需求拆解Agent等多个领域Agent组成，完成从用户需求到需求交付及运维监控等工作 [60][61] - 技术普惠方面，AI让技术更人性化，使更多人参与研发工作 [62][63]