Workflow
智能体编程
icon
搜索文档
GitHub前CEO推出面向智能体编程时代的开发者平台
搜狐财经· 2026-02-25 18:18
公司概况与融资 - Entire是由前GitHub CEO托马斯·多姆克创立的全新开源开发者平台,旨在为智能体编程时代重新构想开发者与智能体之间的协作 [2] - 公司获得了6000万美元的种子轮融资,这是开发者工具领域历史上规模最大的种子轮融资 [2] - 本轮融资由Felicis领投,Madrona、Basis Set以及微软旗下风险投资部门M12参投 [2] 创始背景与战略定位 - 创始人托马斯·多姆克在微软工作十多年,其中七年任职于GitHub,四年担任GitHub CEO,其离开是为了回归创业初心,并非为了建立与GitHub直接竞争的平台 [2][3][4] - 微软CEO萨蒂亚·纳德拉对多姆克的创业想法表示支持,并探讨了在微软生态系统内合作的可能性,这解释了微软风投部门M12参与投资的原因 [4] - Entire的战略定位是在技术堆栈中构建更高层次的抽象层,专注于管理智能体的推理过程,而代码仓库仍将是其核心组成部分,不一定与GitHub形成直接竞争 [4] 平台架构与核心产品 - Entire平台采用三层架构:底层是全新构建的Git兼容数据库,中间是语义推理层,顶层是用户界面 [5] - 新数据库层是必要的,因为智能体产生的上下文信息远多于人类,该数据库允许查询代码及其背后的推理过程,并设计为可全球分布式部署以满足数据主权需求 [5] - 公司推出的首个产品是名为Checkpoints的开源工具,属于语义推理层,它能自动提取和记录智能体的推理、意图和结果 [5] - Checkpoints已与Claude Code和Google的Gemini CLI集成,并计划很快支持Open Codex,其功能是让开发者能够审查智能体生成代码的全过程 [5][9] 行业痛点与市场愿景 - 传统开发平台(如GitHub)是为人与人之间的协作设计的,其从问题到拉取请求的整个系统并非为AI智能体时代构建 [3] - 当前先进的开发者经常并行使用十几个智能体,而代码发布的瓶颈已从编写代码转变为审查智能体编写的代码,这导致了开发者的倦怠 [7] - 行业面临的核心挑战是:在应对越来越多网络攻击和推行零信任部署流程(要求人工审查)的同时,需要从流程中移除人工审查代码的瓶颈 [8] - 公司的愿景是在软件项目的整个生命周期内提供语义推理层,使人类或智能体能在未来任何时间点追溯决策制定的原因 [6] 发展计划与商业模式 - 完成融资后,公司计划将员工数量从当前的15人增加到约30人,并计划将团队扩展到“数百个智能体” [8][9] - 创始人指出,在2026年,企业领导者需要考虑的“员工”成本不仅包括工资福利,还应包含智能体使用所产生的Token费用,已有工程师每月产生数千美元的Token费用 [9] - 公司计划采用成熟的开源商业模式:在宽松许可下提供平台大部分功能,然后通过提供具有附加功能的托管服务来实现盈利 [9]
苹果(AAPL.US)押注AI编程热潮:引入Anthropic与OpenAI智能体至旗舰编程工具Xcode
智通财经· 2026-02-04 15:12
公司动态:苹果Xcode引入智能体编程功能 - 苹果公司宣布在其旗舰编程工具Xcode中引入智能体编程功能,正式加入当前硅谷最热的技术浪潮 [1] - 通过智能体编程,程序员可借助人工智能软件独立编写代码,苹果的工具将支持Anthropic的Claude智能体和OpenAI的Codex [1] - 苹果代表表示,Xcode现在可与编程智能体协同工作,代表开发者处理复杂的多步骤任务 [1] - 此次更新将合作延伸至智能体编程工具,智能体将能够构建和测试项目、检索苹果官方文档并修复问题 [1] - 新版软件Xcode 26.3目前以测试版形式向注册开发者开放,后续将在App Store正式发布 [2] 技术整合与生态开放 - 用户需通过API密钥将OpenAI或Anthropic账户连接至Xcode [2] - 苹果表示其采用开放标准,使开发者除内置的Anthropic和OpenAI集成外,还能在Xcode中使用其他兼容的智能体与AI工具 [2] - 今年夏季,苹果已更新Xcode以支持OpenAI的ChatGPT和Claude [1] 行业趋势与市场接纳 - 独立程序员和企业已接纳智能体编程,将其视为通过自然语言编程来加速软件开发的新路径 [1] - 近几个月来,AI编程在iPhone开发者中已迅速普及 [1] - 值得注意的是,OpenAI已于周一发布了其智能体编程应用Codex的Mac版本 [2] 产品背景与市场地位 - Xcode是苹果为开发者提供的集成开发环境,几乎每一款iPhone应用都基于此工具开发 [2] - 苹果面向消费者的AI套件"Apple Intelligence"曾面临推迟发布和管理层变动等挑战 [1]
吴恩达年度AI总结来了!附带一份软件开发学习小tips
量子位· 2025-12-30 14:33
文章核心观点 文章总结了吴恩达提出的2025年几大核心AI趋势,认为行业正经历从模型能力、人才竞争、基础设施到应用范式的全面变革,标志着一个由AI驱动的新工业时代正在拉开帷幕[5][7][33] 2025最热AI趋势 趋势1:模型会推理正在成为标配 - “会推理”从少数模型的特权转变为模型的标配能力[7][8] - 其萌芽可追溯至“让我们一步一步思考”提示词的提出,后通过强化学习微调将推理能力固化到模型中[9][10] - 范式转变始于OpenAI的o1模型,首次将多步骤的智能体推理工作流内置到模型架构中,带来性能飞跃[12] - DeepSeek-R1的发布进一步证明了该模式的可复现与可优化,并以开源姿态提供了技术路线图[12] - 但研究也指出推理模型存在局限性:可能在超出特定复杂度时失败,且推理步骤可能遗漏关键决策信息[14][15] - 推理能力提升性能的代价高昂,例如Gemini 3 Flash启用推理消耗1.6亿Token(得分71),未启用仅消耗740万Token(得分55)[16] - 当前模型优化的核心战场是如何在不牺牲性能的前提下大幅压缩推理成本并提升响应速度[17] 趋势2:由Meta点燃的AI人才争夺战 - Meta的激进招聘策略将AI精英薪酬推至堪比职业体育明星的高度,彻底重塑了科技行业人才定价体系[19][24] - 自2025年7月宣布成立“Meta超级智能实验室”起,Meta为顶尖人才开出数亿美元薪酬包,CEO亲自游说[20] - 此策略引发顶级人才在巨头间流动加剧的连锁反应[21] - 这场“军备竞赛”背后是AI价值定位历经十余年的根本性跃迁,薪酬演变分为四个阶段:学术期(薪酬与普通软件工程师无异)、商业化初期(顶级薪酬跃升至50万美元)、大模型爆发期(顶级工程师年薪突破70万美元)、军备竞赛期(出现数亿美元级“球星合约”)[23][27] - 行业共识认为,对于志在参与AGI竞赛的公司,天价薪酬是战略性的必要开支[23] - 到2026年,人才争夺可能从单纯价格战演变为薪酬结构、文化认同与长期潜力的综合博弈[23] 趋势3:数据中心的火热标志着新工业时代的到来 - 数据中心正成为AI时代新的“钢铁厂”与“发电站”,其建设规模堪比国家级基建项目,标志着AI竞赛进入“重资产”工业时代[25][26] - 2025年,各大公司宣布了巨额数据中心建设计划:OpenAI启动耗资5000亿美元的“星际之门”项目;Meta今年基础设施投入约720亿美元,其中“Hyperion”数据中心价值270亿美元;亚马逊预计2025年投入1250亿美元[28] - 仅2025年一年,AI行业资本支出就超过3000亿美元,其中绝大部分流向数据中心建设[29] - 麦肯锡预测,为满足AI训练与推理需求,到2030年总投资额可能高达5.2万亿美元[29] - 数据中心热潮面临三大挑战:一是供需是否合理,贝恩咨询指出到2030年全球AI年收入需达到2万亿美元(超过六大科技巨头2024年收入总和)才能支撑投资;二是电力供应制约,已有数据中心因无法接入电网而闲置;三是市场回归理性,已有金融机构因担忧企业债务过高而退出百亿美元级别的融资项目[30][31] - 数据中心投资已产生实体经济拉动效应,2025年上半年美国GDP的增长几乎全部由数据中心和AI投资所贡献[32] 趋势4:智能体编程正在从“打辅”走向“主导” - 以AI智能体驱动的自动化编程正在彻底重塑软件构建的方式[7][34] - 到2025年,编码智能体在同类任务上的完成率已普遍突破80%[35] - 智能体已演变为能够规划任务、调用工具、审查代码并操控整个代码库的“数字工程师”[36] - 模型推理能力的进步为智能体注入了“灵魂”,使其能先“想清楚”再行动,并通过将复杂任务分解交由低成本模型执行来降低整体计算成本[37] - 此趋势催生了新行业,以Loveable、Replit为代表的初创公司让毫无编程经验的用户也能“一键生成”Web应用[40] - AI辅助编码正迅速变为“编码”行为本身不可分割的一部分[41] 软件开发学习建议 - 核心建议是保持持续学习,通过“知行合一”的方式精进技能[42][44] - 具体方法有三点:一是多参加人工智能课程,进行结构化学习,避免在不了解基础知识的情况下重复造轮子[45][47];二是必须动手实践,亲自构建AI系统,因为很多经验只能通过实践获得[45][48][49];三是在闲暇之余多读一些技术论文,这有助于提升竞争力[45][52]
智能体编程平台Qoder Teams版正式上线
第一财经· 2025-12-15 18:40
公司产品发布 - 智能体编程平台Qoder Teams团队版正式上线 [1] - 该版本面向企业用户开放 [1] - 新版本提供统一采购、集中管理和共享资源包等能力 [1]
连续干7小时“不累”,OpenAI最强编程模型GPT-5-Codex来了
36氪· 2025-09-16 10:07
模型发布与性能提升 - OpenAI发布GPT-5-Codex模型,专门针对软件工程优化,提升智能体编程能力 [1] - 新模型在基准测试SWE-bench Verified中准确率达74.5%,较GPT-5的72.8%提升1.7个百分点 [4] - 代码重构任务准确率显著提升至51.3%,较GPT-5的33.9%提高17.4个百分点 [5] - 错误评论率从GPT-5的13.7%降至4.4%,高影响力评论占比从39.4%提升至52.4% [9] - 每个拉取请求平均评论数由1.32条降至0.9条,表明评论质量更精准 [9] 技术特性与创新 - 模型可根据任务复杂度动态调整思考时间,支持从几秒到7小时不等的独立工作周期 [1][4] - 在生成token数最少的后10%场景中,token使用量比GPT-5减少93.7% [7] - 前10%复杂任务场景中,思考时间达到GPT-5的两倍,强化深度推理能力 [7] - 采用无路由器架构,可实时调整计算资源分配,优于预设计算力的传统路由方案 [12] 产品整合与开发者体验 - GPT-5-Codex全面覆盖Codex应用场景,包括云端任务、代码审查及本地开发环境 [2] - 通过CLI和IDE扩展支持图像上传(截图/线框图/图表),增强设计上下文共享能力 [14][17] - IDE扩展支持VS Code等编辑器,实现本地与云端环境无缝切换且保留完整上下文 [16] - 云基础设施优化使任务平均完成时间缩短90%,支持自动环境配置与依赖安装 [16] 代码审查与工作流自动化 - 模型可自动审查GitHub拉取请求,匹配开发意图与实际代码差异,执行测试验证 [20] - 支持安全漏洞、过时依赖项等定向审查指令,可直接在对话线程中实施修改建议 [20] - 前端开发中可启动浏览器预览构建效果,迭代结果自动截图并关联至任务及GitHub [18] - OpenAI内部每日通过Codex发现数百个代码问题,优先于人工审查介入 [20] 行业竞争格局 - AI编程工具竞争加剧,主要参与者包括OpenAI Codex、Claude Code、GitHub Copilot等 [21] - Cursor编辑器年度经常性收入(ARR)预计2025年初超5亿美元,反映市场快速增长 [21] - 模型升级表明行业技术迭代加速,自动化编程与协作能力成为核心竞争维度 [21]
Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了
36氪· 2025-09-04 16:16
融资与市场动态 - Anthropic完成130亿美元融资 公司估值达到1830亿美元 融资规模仅次于OpenAI 2025年3月的400亿美元融资[1] - Claude Code发布4个月用户达11.5万 从Cursor抢占大量市场份额[3] 产品性能争议 - 部分用户反馈Claude Code存在降智问题 部分开发者转向OpenAI竞品Codex Cli[1] 产品设计理念 - 采用极简易用与高度可扩展的设计理念 集成系统提示/上下文管理/工具调用等综合功能[3][6][14] - 建立极致用户反馈响应机制 开发团队可在2-3小时内快速修复问题并回复用户[13] 技术演进趋势 - 编程模式从手动复制粘贴转向智能体主导的"不插手"工作方式 智能体可独立完成应用开发[3][4] - 模型与工具协同进化 Sonnet 3.7/4.0和Opus 4.1版本显著提升智能体编程能力[5][6][7] - 模型自主运行时间从Sonnet 3.5的1分钟持续延长 记忆能力和指令执行准确性提升[8][15] 性能评估方法 - 采用真实体感大于基准测试的评估标准 通过实际工作场景测试模型性能[3][9] - 最佳评估方式为模拟真实工作流程 包括写代码/修复bug/处理Slack消息等多元化任务[10][11] 生态扩展能力 - 扩展系统从初始的CLAUDE.md文件发展为包含权限管理/Hooks系统/MCP集成的复杂生态[15] - 支持斜杠命令和子智能体等扩展点 与模型能力提升形成正向循环[15] 未来发展方向 - 工作模式将呈现手动与自动深度融合 向交互式/主动化/目标导向编程演进[16] - 未来12-24个月重点发展高层目标规划能力 模拟工程师制定月度目标的宏观规划模式[16] 开发者影响与建议 - 智能体编程降低技术门槛 重点从"如何实现"转向"实现什么" 释放创造潜力[17] - 建议新手先使用智能体理解代码库再编写代码 根据任务难度选择差异化的协作模式[18][19][20][21] - 保持核心编程语言/编译器/系统设计等基础技能 同时提升创造性思维[17]
Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了
机器之心· 2025-09-04 15:04
融资与市场表现 - Anthropic完成130亿美元融资 公司估值达到1830亿美元 融资规模仅次于OpenAI 2025年3月的400亿美元融资[1] - Claude Code发布4个月用户达11.5万 从竞品Cursor处抢走大量用户[3] 产品优势与设计理念 - 产品设计强调极简易用和高度可扩展性[3][18] - 采用真实体感大于基准测试的评估标准 通过日常实际使用评估模型性能[3][11][13] - 建立极致用户反馈响应机制 对反馈进行快速修复并立即回复用户[15][16] 技术演进与行业变革 - 编程工作流核心转变为智能体主导 从手动复制粘贴代码转向"不插手"的自动化执行模式[6] - 模型能力显著提升 Sonnet 3.7/4和Opus 4.1版本推动智能体编程进步[8] - 工具与模型共同进化 Claude Code集成系统提示/上下文管理/工具调用等关键技术组件[9] - 模型自主运行时间大幅延长 从Sonnet 3.5的1分钟持续运行能力实现突破性提升[10] 产品发展路线图 - 扩展性成为核心发展方向 已构建复杂设置系统/权限管理/Hooks系统/MCP集成等扩展点[18][21] - 未来6-12个月将实现手动与自动深度融合 包括交互式编程和目标导向编程模式[20][22][28] - 智能体将具备宏观规划能力 通过系列小改动实现月度目标[22] 开发者策略建议 - 新手应先使用智能体理解代码库 再逐步过渡到代码编写[24] - 按任务复杂度分级处理:简单任务直接创建PR 中等任务先制定计划 困难任务以人为主导[26][29] - 技术栈复杂度降低 开发重点从"如何实现"转向"实现什么"[23] - 保持核心编程技能基础上 重点提升创造力和产品构思能力[23]
刚刚,阿里最强编程模型开源,4800亿参数,Agent分数碾Kimi K2,训练细节公开
36氪· 2025-07-23 07:53
模型发布与性能 - 阿里巴巴Qwen团队开源最新旗舰编程模型Qwen3-Coder-480B-A35B-Instruct,拥有480B参数,激活参数35B,原生支持256K上下文并可扩展至100万上下文,最大输出6.5万token [1] - 该模型在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use三类任务中获得开源SOTA,性能超过Kimi K2、DeepSeek V3等开源模型和GPT-4.1等闭源模型,与Claude Sonnet 4相当 [1] - 模型参数量超过阿里旗舰模型Qwen3的235B,小于Kimi K2的1T,官方称可帮助新人程序员一天完成资深程序员一周的工作,生成品牌官网最快只需5分钟 [2] 技术细节与训练 - 预训练使用7.5万亿token数据,其中代码占比70%,保留通用和数学能力,原生支持256K上下文并通过YaRN扩展至1M,针对仓库规模和动态数据优化 [16] - 后训练阶段在20000个独立环境中进行大规模强化学习,自动扩展多样化编程任务的测试用例创建高质量训练实例,提高代码执行成功率 [18][20] - 引入长视距强化学习(智能体强化学习),构建可扩展系统并行运行20000个独立环境,在SWE-Bench Verified中实现开源模型最佳性能且无需推理 [20] 产品化与商业化 - 模型已在阿里云百炼平台上线,API采用阶梯计费,256K~1M档输入价格6美元/百万token,输出60美元/百万token,高于Claude Sonnet 4同档价格 [4][5] - 提供多种部署方式:Qwen Chat网页版免费体验,480B版本在Hugging Face、魔搭等开源社区发布可供下载和本地部署 [6] - 同时开源智能体编程命令行工具Qwen Code,基于Gemini Code分叉而来,进行定制提示和函数调用协议适配以更好释放模型能力 [3][22] 应用案例与表现 - 实测案例显示模型在指令遵循、UI设计、动画方面能力突出,开发Wordle游戏、3D旋转立方体展示台等任务完成度高 [7][9][12] - 开发速度极快,如中英文术语库20多秒完成初步结果,但存在未完全遵循技术栈指令等问题,真实部署可扩展性需优化 [11] - 支持图像生成、视频生成等功能,可上传文档、图片、视频、音频等内容,可能通过工具调用实现 [12]