文章核心观点 - 由清华姚班校友领军的中国初创公司“词元无限”开发的编码智能体InfCode,在SWE-Bench Verified和Multi-SWE-bench-CPP两项权威基准测试中均取得第一名的成绩,标志着AI编程从注重快速原型的“感性时代”(Vibe Coding)进入了面向企业级复杂工程的“工程时代” [6][9] - InfCode的技术突破主要体现在其多智能体体系,能够解决传统AI编程在大型代码库、跨文件修改和C++等系统级语言中面临的挑战,为企业引入AI编码提供了从“单体提效”走向“组织进化”的新范式 [8][12][17] AI编程范式演进与行业基准 - AI编程正从传统大模型生成代码片段,演进为强调自主性、全流程覆盖和工程实用性的“编码智能体”(Coding Agent)时代 [10][11] - SWE-Bench Verified:由普林斯顿大学等提出、OpenAI升级的权威基准,包含来自真实GitHub项目的Python问题,要求智能体解决问题且不破坏其他功能 [11] - Multi-SWE-bench:由字节跳动等机构于2025年推出,覆盖Java、TypeScript、JavaScript、Go、Rust、C与C++七种语言,包含1632个人工验证的修复任务 [11] - 系统级语言(如C++)的修复任务远难于高级语言,通常需要一次修改200多行、涉及7个文件,导致大语言模型表现显著降低,领先模型的解决率往往不足8% [12][16] 公司产品InfCode的性能表现 - 在SWE-Bench Verified基准上,InfCode以Pass@1得分79.4% 刷新世界最佳记录(SOTA),远高于公开排行榜上GPT-5、Claude等顶尖模型约70%的成绩 [7][14] - 在Multi-SWE-bench的C++子集上,InfCode达到25.58% 的解决率,大幅领先于Claude 3.7 Sonnet的8.59%、DeepSeek V3的7.75% 以及Qwen2.5-72B-Instruct几乎为零的解决率 [7][15][16] - 该成绩体现了产品在复杂语法和大型项目中生成正确补丁的能力,对工业界具有重要价值 [17] InfCode的核心技术亮点 - 基于功能意图的复杂上下文定位:提出“代码意图分析”机制,超越传统基于向量相似度的RAG,通过理解自然语言背后的功能意图并将其映射到具体实现单元,精准定位问题代码,尤其在无堆栈信息的条件下表现突出 [20][21] - 基于AST的结构化检索:自研基于抽象语法树的结构化检索引擎,通过Tree-Sitter构建完整语法树,提供如FindClass、FindFunction等语法层API,实现语法感知搜索,在C++等复杂语言中能高精度定位bug,避免传统文本搜索工具(如grep)的噪声问题 [22][23][25][26][28] - 对抗式双智能体生成架构:首创由代码补丁生成器与测试补丁生成器构成的对抗式双智能体架构,二者在闭环中交替迭代,使补丁在鲁棒性与完备性上持续演化,达到工程级质量,契合了下一代编码智能体迭代-验证-优化的核心范式 [29][30][31][32][33] 产品的工程化流程 - 修复流程分为生成与筛选两阶段 [35] - 生成阶段:系统并行启动多个独立容器运行修复链路,允许模型查看代码库、运行测试、分析错误,并最多进行五轮迭代以产生多样化候选补丁 [40] - 筛选阶段:在真实构建和测试环境中重放每个补丁,除验证测试通过外,还考虑行为一致性、稳定性和副作用,最终选出具有更强工程完整性与可维护性的补丁 [40] 公司团队背景与战略 - 核心团队由清华姚班校友带队,拥有顶尖技术实力,并融合了技术前瞻、产品化能力与商业化思维 [6][42] - 团队领军人物杨萍曾在字节跳动主导创立公司首个软件工程实验室,其孵化的内部AI Coding产品已全面覆盖公司研发体系,对在超大规模组织中应用AI有深刻理解 [42] - CTO 王伟来自清华姚班,曾带队在SWE-Bench获得全球第二的成绩,具备扎实的大模型与智能体算法工程经验 [42] - 商业化负责人 李莹拥有十余年AI产业落地经验,曾主导完成大模型To B领域数亿元规模的项目落地,具备将技术价值转化为商业回报的能力 [43] - 团队汇聚了来自字节、百度、微软等顶尖企业及清华、北大、哥大、MIT等世界名校的人才,构成“顶尖老将 + 新生代骨干”组合,多个重要岗位由00后领衔 [43] - 公司对AI Coding赛道的认知已从“工具效能”提升转向对软件工程全生命周期的重构(AI SWE),致力于打造提供端到端价值闭环的“数字员工”平台,并通过“Coding + 细分行业”的深度融合构建商业生态闭环 [44]
字节前技术负责人联手清华姚班校友创业!
具身智能之心·2025-12-06 00:02