Workflow
InfCode
icon
搜索文档
前字节女将联手姚班大牛,打造AI Coding新势力,拿下数千万融资
搜狐财经· 2026-01-04 22:52
公司融资与团队背景 - 公司词元无限于2025年7月成立,并于近期完成数千万人民币天使轮融资,投资方为某软件产业CVC,航行资本担任长期财务顾问 [2] - 公司核心团队为豪华班底,领军人物杨萍曾任字节跳动AI技术负责人,主导创立字节首个软件工程实验室,CTO王伟为清华姚班出身的技术大牛,战略商业化负责人李莹拥有十余年AI产业落地经验,曾促成多家央国企和世界500强客户的亿级签约与交付 [5] - 团队已从最初三人扩展至约30人规模,汇聚了来自字节、百度、微软等顶尖企业及清华、北大、哥大、MIT等世界名校的多元化人才 [6] 产品技术与性能 - 公司核心产品智能体InfCode在SWE‑Bench Verified榜单上以79.4%的Pass@1得分刷新SOTA,显著领先于GPT‑5、Claude等顶尖模型约65%的表现 [2] - 在Multi‑SWE‑bench的C++子集榜单上,InfCode取得了25.58%的解决率,远超同类产品 [2][8] - 产品技术采用“大模型+Agent”协同架构,精准复刻真实研发流程,并通过专门研发的对抗式测试优化方案提升工业级复杂问题的解决能力 [7][8][9] 市场定位与商业模式 - 公司定位于企业级AI Coding赛道,专注于解决企业级复杂软件交付中的数据安全、场景适配、效能提升等高价值痛点,而非聚焦C端轻量化场景 [6][13] - 商业化采取“三步走”策略:先用轻量化插件切入,再推出AI原生企业级研发平台,最终打造“平台+服务+交付”的全链路能力 [13] - 公司已服务金融、通信、供应链、制造等多个行业的客户,并与头部IT服务商、国内头部汽车集团和军工电子央企等达成合作,在复杂系统改造、智能体落地和私有化部署领域积累实战经验 [4][13] 产品规划与发展愿景 - 公司当前已推出InfCode公测版本,并计划在年初推出更重磅的多智能体平台,旨在实现智能体与人的协同开发,覆盖需求、设计、开发、测试、运维全链路 [10] - 公司愿景是构建一个全面的企业级AI生产力平台,不仅提供AI Coding工具,还希望通过多智能体机制将AI覆盖到理解需求、沟通协作等非编码流程中,占据开发者约70%的工作时间 [12] - 长远目标是成为产业生态赋能者,通过AI Coding技术重构软件生产方式,打开千亿级的市场空间,公司判断国内AI赋能软件交付的市场空间达五六千亿 [14][15]
前字节技术负责人创业,要做企业级Coding Agent平台,已获数千万元融资 | 36氪专访
36氪· 2025-12-30 08:13
AI Coding赛道发展现状与市场格局 - 2024年Vibe Coding赛道发展迅猛,明星公司Cursor的年经常性收入从2023年的100万美元暴涨至2024年11月的6500万美元,估值在四个月内翻了超6倍 [2] - 市场变化体现在两个维度:一是C端产品获得高估值且收入猛涨,证明了真实市场需求;二是市场格局重构,越来越多厂商从C端转向B端,企业级需求开始爆发 [5] - C端AI产品(如Cursor、Replit、ChatGPT)的迅速普及,提升了企业研发群体对AI的接受度和付费意愿,远超预期 [13] 公司创业背景与团队构成 - 公司创始人杨萍原为字节跳动技术研发负责人,自2021年起带领百人团队探索AI在软件领域的应用,其产品曾服务字节内部数万研发人员,帮助公司节省亿级别研发预算 [2] - 杨萍于2024年8月离开字节,并于2025年7月与两位联创正式成立新公司“词元无限” [6][15] - 公司近期完成数千万元天使轮融资,投资方为某软件产业CVC [7] - 团队吸纳了资深人才,CTO王伟为清华姚班校友,曾任国内知名具身机器人公司与大模型创业公司的技术合伙人;商业化负责人李莹拥有十余年AI产业落地经验,曾在大模型To B领域主导完成数亿元规模的项目落地 [7] 公司产品:InfCode平台 - 公司核心产品InfCode于12月初上线第一个版本,形态为插件+企业级AI Coding平台 [10] - 产品帮助企业完成代码治理、补全、审查、任务规划等工作,能力相当于一个中阶研发工程师 [10] - 产品通过两层机制解决企业适配问题:第一层是标准化对接,通过内置MCP Server连接器快速集成飞书、企业OA等常见办公系统;第二层是个性化适配,针对企业独特的微服务架构和遗留系统提供开放接口 [10] - 在全球权威智能体评测基准SWE-Bench Verified上,InfCode以79.4%的得分刷新了世界最佳纪录,超过公开排行榜上GPT-5、Claude等顶尖模型65%左右的成绩 [12] 目标市场与核心价值主张 - 公司专注于面向B端企业的AI Coding Agent服务,聚焦于严肃级的企业级编程场景,解决规模化、复杂的软件交付全流程问题 [6][18] - 与主打轻量化软件交付的C端Vibe Coding产品不同,公司致力于解决企业复杂的遗留系统、技术栈和严苛业务规范下的问题,例如金融、医药等关键行业的合规要求 [7][17][20] - 企业级场景与Vibe Coding在很大程度上相悖,因为前者要求结果确定、服务稳定,并需在特定业务上下文和规范下完成 [21] 产品技术实现与效果 - 为解决企业级场景中模型上下文窗口有限的挑战,Agent设计了两层机制:内功方面进行上下文优化(如动态压缩、加载卸载机制);外功方面通过MCP等开放协议连接企业研发过程中的各类信息 [23] - 在实际POC验证中,合作客户的研发效率提升了近40%,AI生成代码的可用率达到88%以上,质量达到中级程序员水平 [11] - 在一个金融上市公司案例中,实施分为两步:第一步提供标准化产品并关注上下文工程;第二步解决信息对接问题,最终帮助客户提升了将近40%的人效 [24][26] - 公司衡量价值的方式是以结果为导向,直接对比人力投入(如研发周期人天),而非中间过程的AI准确率 [12][27] 商业模式与收费 - 商业模式正探索以结果为导向的方式,即RaaS [13] - 收费模式针对工具类产品收取License授权和Agent订阅费;针对平台类产品,除标准费用外也在考虑分润模式 [30] 市场竞争与公司战略 - 尽管阿里、字节、百度等大厂及Cursor等垂类厂商也在布局,但公司认为头部企业的布局未必意味着市场终局,许多大厂的根本动机在于作为云服务与模型业务的入口策略,而非产品本身 [41] - 当前端到端的AI编程尚未形成明确市场标准与行业共识,公司认为这是一个关键的时间窗口,必须加速确立标准并深度打通企业级研发流程 [42] - 公司认为AI Coding领域的最终形态将从单体工具进化到人机协作模式,并最终演变为程序员群体本身,改变生产力主体和组织 [43] - 公司发展将分三个阶段迭代:第一阶段以工具形态轻量化嵌入企业;第二阶段变为工具+平台,作为连接器;第三阶段目标是构建Agent集成平台 [39][40][33] 行业机遇与挑战 - 基础模型发展迅速,2025年基础模型厂商在Agent能力上建设不遗余力,新模型带来的业务价值立竿见影 [13] - 传统SaaS更多是标准化模块固化流程,而AI Coding的核心价值是通过动态能力组合解决企业复杂问题,推动业务从流程执行走向智能决策与生成 [46] - AI Coding与以前AI模式的最大区别在于,它本质上是在创造一种由AI驱动的数字劳动力,使得规模化扩展、个性化方案与低实施成本的不可能三角获得了新的可能性 [47] - 当前To B的AI Coding产品尚未形成市场标准和供需平衡,但存在巨大商业价值,市场存在红利 [51]
字节前技术负责人联手清华姚班校友创业!
具身智能之心· 2025-12-06 00:02
文章核心观点 - 由清华姚班校友领军的中国初创公司“词元无限”开发的编码智能体InfCode,在SWE-Bench Verified和Multi-SWE-bench-CPP两项权威基准测试中均取得第一名的成绩,标志着AI编程从注重快速原型的“感性时代”(Vibe Coding)进入了面向企业级复杂工程的“工程时代” [6][9] - InfCode的技术突破主要体现在其多智能体体系,能够解决传统AI编程在大型代码库、跨文件修改和C++等系统级语言中面临的挑战,为企业引入AI编码提供了从“单体提效”走向“组织进化”的新范式 [8][12][17] AI编程范式演进与行业基准 - AI编程正从传统大模型生成代码片段,演进为强调自主性、全流程覆盖和工程实用性的“编码智能体”(Coding Agent)时代 [10][11] - **SWE-Bench Verified**:由普林斯顿大学等提出、OpenAI升级的权威基准,包含来自真实GitHub项目的Python问题,要求智能体解决问题且不破坏其他功能 [11] - **Multi-SWE-bench**:由字节跳动等机构于2025年推出,覆盖Java、TypeScript、JavaScript、Go、Rust、C与C++七种语言,包含1632个人工验证的修复任务 [11] - 系统级语言(如C++)的修复任务远难于高级语言,通常需要一次修改200多行、涉及7个文件,导致大语言模型表现显著降低,领先模型的解决率往往不足8% [12][16] 公司产品InfCode的性能表现 - 在**SWE-Bench Verified**基准上,InfCode以Pass@1得分**79.4%** 刷新世界最佳记录(SOTA),远高于公开排行榜上GPT-5、Claude等顶尖模型约70%的成绩 [7][14] - 在**Multi-SWE-bench的C++子集**上,InfCode达到**25.58%** 的解决率,大幅领先于Claude 3.7 Sonnet的**8.59%**、DeepSeek V3的**7.75%** 以及Qwen2.5-72B-Instruct几乎为零的解决率 [7][15][16] - 该成绩体现了产品在复杂语法和大型项目中生成正确补丁的能力,对工业界具有重要价值 [17] InfCode的核心技术亮点 - **基于功能意图的复杂上下文定位**:提出“代码意图分析”机制,超越传统基于向量相似度的RAG,通过理解自然语言背后的功能意图并将其映射到具体实现单元,精准定位问题代码,尤其在无堆栈信息的条件下表现突出 [20][21] - **基于AST的结构化检索**:自研基于抽象语法树的结构化检索引擎,通过Tree-Sitter构建完整语法树,提供如FindClass、FindFunction等语法层API,实现语法感知搜索,在C++等复杂语言中能高精度定位bug,避免传统文本搜索工具(如grep)的噪声问题 [22][23][25][26][28] - **对抗式双智能体生成架构**:首创由代码补丁生成器与测试补丁生成器构成的对抗式双智能体架构,二者在闭环中交替迭代,使补丁在鲁棒性与完备性上持续演化,达到工程级质量,契合了下一代编码智能体迭代-验证-优化的核心范式 [29][30][31][32][33] 产品的工程化流程 - 修复流程分为**生成**与**筛选**两阶段 [35] - **生成阶段**:系统并行启动多个独立容器运行修复链路,允许模型查看代码库、运行测试、分析错误,并最多进行五轮迭代以产生多样化候选补丁 [40] - **筛选阶段**:在真实构建和测试环境中重放每个补丁,除验证测试通过外,还考虑行为一致性、稳定性和副作用,最终选出具有更强工程完整性与可维护性的补丁 [40] 公司团队背景与战略 - 核心团队由**清华姚班校友**带队,拥有顶尖技术实力,并融合了技术前瞻、产品化能力与商业化思维 [6][42] - 团队领军人物**杨萍**曾在字节跳动主导创立公司首个软件工程实验室,其孵化的内部AI Coding产品已全面覆盖公司研发体系,对在超大规模组织中应用AI有深刻理解 [42] - **CTO 王伟**来自清华姚班,曾带队在SWE-Bench获得全球第二的成绩,具备扎实的大模型与智能体算法工程经验 [42] - **商业化负责人 李莹**拥有十余年AI产业落地经验,曾主导完成大模型To B领域数亿元规模的项目落地,具备将技术价值转化为商业回报的能力 [43] - 团队汇聚了来自字节、百度、微软等顶尖企业及清华、北大、哥大、MIT等世界名校的人才,构成“顶尖老将 + 新生代骨干”组合,多个重要岗位由00后领衔 [43] - 公司对AI Coding赛道的认知已从“工具效能”提升转向对软件工程全生命周期的重构(AI SWE),致力于打造提供端到端价值闭环的“数字员工”平台,并通过“Coding + 细分行业”的深度融合构建商业生态闭环 [44]
字节前技术负责人创业,联手清华姚班校友,编程智能体世界登顶
机器之心· 2025-12-05 12:08
文章核心观点 - InfCode编码智能体定义了AI编程的“工程时代”,其多智能体体系标志着AI编程从“单体提效”走向企业“组织进化”的新范式[2][7] - 公司在SWE-Bench Verified和Multi-SWE-bench-CPP两项权威AI Coding基准中双双登顶,展现了面向企业场景设计的突破性技术能力[4][6] AI编程行业趋势与基准 - AI编程正从传统大模型生成代码片段转向强调自主性、全流程覆盖和工程实用性的新一代编码智能体(Coding Agent)[9] - SWE-Bench Verified基准来自真实GitHub项目,要求智能体解决问题且不破坏其他功能,是行业权威评测标准[9] - Multi-SWE-bench数据集覆盖七种编程语言共1632个修复任务,由68名专家从2456个候选样本中精挑细选[9] - C++项目通常需一次修改200多行、涉及7个文件,难度远高于JavaScript等高层语言,领先模型在C++上的解决率往往不足8%[10] InfCode技术突破与性能表现 - 在SWE-Bench Verified上以79.4%的Pass@1得分刷新SOTA,远高于公开排行榜上GPT-5、Claude等顶尖模型70%左右的成绩[6][13] - 在Multi-SWE-bench的C++子集上达到25.58%的解决率,大幅领先Claude 3.7 Sonnet的8.59%和DeepSeek V3的7.75%[6][13] - 针对系统语言(C、C++、Rust)在内存管理、模板机制和复杂编译链方面的难度,实现了语义定位与语法分析相结合的优势[15] 核心技术亮点 - 提出“代码意图分析(Code Intent Analysis)”机制,超越传统RAG的字面匹配,能理解自然语言背后的功能意图并映射到具体实现单元[17][18] - 自研基于抽象语法树(AST)的结构化检索引擎,通过Tree-Sitter构建完整语法树,提供FindClass、FindFunction等语法层API[21][22] - 首创对抗式双智能体架构,代码补丁生成器与测试补丁生成器在闭环中交替迭代,实现“越测越强、越修越稳”的工程级质量[24][25] - 修复流程采用生成与筛选两阶段范式,在真实构建和测试环境中重放每个补丁,最终选出具有更强工程完整性与可维护性的补丁[31][33] 团队背景与竞争优势 - 核心团队由清华姚班校友带队,汇聚来自字节、百度、微软等顶尖企业的精英及世界名校人才,构成“顶尖老将+新生代骨干”组合[35][37] - 团队领军人杨萍在字节跳动期间主导创立公司首个软件工程实验室,其孵化的内部AI Coding产品已全面覆盖公司研发体系[35] - CTO王伟在大模型与智能体领域深耕多年,此前带队在SWE-Bench曾斩获全球第二成绩[36] - 商业化负责人李莹拥有十余年AI产业落地经验,曾主导完成数亿元规模的大模型To B项目落地[37] - 团队对AI Coding赛道有清晰认知,竞争已从“工具效能”提升转向对软件工程全生命周期的重构(AI SWE)[38]