报告行业投资评级 未提及 报告的核心观点 报告围绕蚂蚁智能研发展开,介绍CodeFuse在研发全生命周期提效探索、蚂蚁大模型发展路线、智能研发发展路线,分析算法和工程关键技术与难点,还对未来软件研发领域发展方向进行思考 [4][10][23] 根据相关目录分别进行总结 研发提效探索 - CodeFuse探索在蚂蚁研发全生命周期提效,涉及代码大模型探索,开发者在编写代码、调试代码等活动耗时多,代码补全、代码问答等功能使用占比受关注 [4][8][9] - 蚂蚁大模型发展历经多阶段,从2022年GPT - 3模型落地(0.25B模型、代码行补全)到2024年CodeFuse持续升级(BigCode第一名、仓库级代码问答等) [10][11][17] - 大模型能力演进包括集成平台知识库加训、结合平台能力智能化改造、通过SOP编排多领域Agent完成任务;效能平台产品从工具化向智能化、AI Native演进 [18][20] - CodeFuse代码大模型落地覆盖需求分析、编码自测、联调测试等环节,具备需求智能拆解、代码补全、测试用例生成等核心能力 [21] 智能研发发展路线 - 智能研发有Copilot + Chat、Copilot + Agent、AI Native三种模式Copilot + Chat是传统效能平台集成AI能力,在生成式、总结类、推理类场景智能化升级;Copilot + Agent是传统效能平台与AI能力深入结合,以领域Agent为核心升级;AI Native是AI能力友好嵌入用户操作 [25][26][28] 关键技术与难点 - 算法关键技术与难点:代码补全模型面临代码底座大模型到产品落地挑战,如代码能力、自回归训练、语法、感知范围、推理部署等问题,对应解决方案有预训练 + MFT微调、FIM、BlockFim、RepoFuse、ModelOps加速 [32][33] - 工程关键技术与难点:算法模型到产品落地存在触发时机、上下文边界、实时 + 耗时、效果优化、多模型/多策略等挑战,解决方法有触发时机优化、RAG + 程序分析、本地存储/索引、PE/前后处理、AB平台等 [34][35] - 解决模型幻觉问题:基于上下文感知学习(ICL)能力,通过预处理构建本地索引、结合RAG + 程序分析强化上下文、扩展感知边界,可提升测试集EM值,解决单文件补全不准问题 [41][45][47] - 解决代码生成不完整问题:基于Block - FIM能力,结合程序分析技术构建Block数据,解决大模型自回归训练不适合代码补全、FIM字符粒度切分样本语法不准确问题 [53][54][55] 未来方案思考 - 人工智能应用阶段分Intelligence、Agent、Copilot、Chat Bot、TOOL,体现人类与AI在工作中的不同协作程度 [58][59] - AI程序员(Multi - Agent技术路线)由调度Agent、需求拆解Agent等多个领域Agent组成,完成从用户需求到需求交付及运维监控等工作 [60][61] - 技术普惠方面,AI让技术更人性化,使更多人参与研发工作 [62][63]
智能研发的点与面:蚂蚁代码大模型落地实践
2024-12-05 14:05