LCP - 财报，业绩电话会，研报，新闻

LCP

搜索文档

量子位· 2025-06-12 16:17

核心观点 - 中兴通讯团队提出两个新的评测指标（LCP和ROUGE-LCP）和一套仓库级代码语料处理框架（SPSR-Graph），旨在提升AI代码补全工具在真实工业场景中的性能 [1][2][5] - 当前AI代码补全工具存在两大痛点：评估指标与用户真实体验脱节、模型缺乏对代码仓库全局结构的理解 [4][5][9] - 新方法通过量化用户采纳行为特征和显式建模代码依赖关系，显著提升了模型实用性和工业适用性 [6][13][25] 新评测指标 LCP（最长公共前缀长度） - 定义：模型输出与用户期望代码从起始位置连续匹配的最大字符数，强调开头部分的准确性 [8][10] - 价值：比传统指标（如LCS）更能反映用户实际交互体验，LCP值与用户采纳率呈显著正相关（r>0.69，最高达0.91） [31][32][38] - 用户行为洞察：开发者更关注补全建议开头部分的正确性，即使后续存在小错误也倾向采纳 [7][42] ROUGE-LCP - 定义：对LCP进行归一化处理，公式为LCP(S,R)/|R|，实现不同长度样本的公平比较 [11][12] - 表现：与采纳率相关性（r=0.62-0.72）虽低于LCP，但仍优于传统指标EM和ROUGE-L [40][43] - 局限性：用户更关注绝对匹配字符数而非相对比例，反映编辑随意性 [41][42] SPSR-Graph框架技术架构 - 核心组件：通过AST解析将代码切割为语义单元（函数/类等），构建保留结构的有向图（节点=语义单元，边=依赖关系） [15][19][20] - 关键流程：语料预处理→AST结构切割→图谱构建→路径遍历生成训练样本（含跨文件结构注释） [18][19][23][24] - 创新点：显式建模跨文件依赖关系，解决传统方法导致的语义割裂问题 [21][22] 实验效果 - 性能提升：在Qwen2.5-7B-Coder模型上，采用KGFS策略使C语言EM提升2.66%，BLEU提升2.74% [44][47] - 最佳参数：代码图谱广度k=4时表现最优，过小则信息不足，过大引入噪声 [48][49] - 多阶段验证：从基础Pipeline到AST切割→函数级图谱(KGF)→结构体级图谱(KGFS)实现"三级跳"式改进 [45][46] 应用前景 - 当前成果：已应用于中兴通讯自研工具ZTE-Code-Copilot，分析超10000条真实用户数据验证有效性 [27][50] - 未来方向：拓展LCP/ROUGE-LCP在更多生成任务的适用性，探索SPSR-Graph与强化学习的结合 [51][52] - 行业价值：为通信领域等垂直场景提供专业化代码补全解决方案，推动智能化开发工具升级 [5][50]

Telecommunications Equipment

Telecommunications Equipment

ZTE-Code-Copilot