Workflow
AI编码工具
icon
搜索文档
OpenAI发布新模型硬刚Anthropic,Claude Code刚火,就被GPT-5-Codex拍在沙滩上?
36氪· 2025-09-16 18:09
9 月 15 日,OpenAI 正式推出一款新模型 GPT-5-Codex ,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。该公司表示,新模型 GPT-5-Codex 的"思考"时间比之前的模型更加动态,完成一项编码任务所需的时间从几秒到七个小时不等。因此,它在代理编码基准测试中表现更佳。 OpenA 推出"最卷",编码智能体 GPT-5-Codex GPT-5-Codex 的一大亮点是其增强的代码审查功能,能够在产品发布前发现潜在的关键错误,帮助开发者提前规避风险。 具体是怎么做到的? 与静态分析工具不同,Codex 将 PR 的声明意图与实际差异进行匹配,对整个代码库及其依赖项进行推理,并执行代码和测试以验证行为。只有最细致的 人工审查人员才能在审查的每个 PR 中投入如此多的努力,因此 Codex 填补了这一空白——帮助团队更早地发现问题,减轻审查人员的负担,并更自信地 交付。 一旦在 GitHub 代码库中启用 Codex,它就会自动审核 PR,直到 PR 从草稿状态变为就绪状态,并在 PR 上发布其分析。如果它建议修改,用户可以留在 同一个线程中,并请求 Codex ...
比996还狠,让面试者8小时复刻出自家Devin,创始人直言:受不了高强度就别来
36氪· 2025-08-28 16:04
公司文化与招聘策略 - 面试流程要求候选人在6-8小时内从零构建端到端AI代理产品 需完成数据库连接 依赖修复和测试验证[2] - 团队文化强调高强度工作模式 每周工作6天且工时超过80小时 明确不接受工作生活平衡理念[2] - 核心团队具有显著创业者背景 初期35名成员中有21人曾创办公司 招聘标准侧重高层次决策能力 技术理解深度和产品直觉[3][46][51] - 工程团队保持精干规模 收购Windsurf前核心工程团队仅19人 收购后扩展至30-35人范围[45] 产品与技术定位 - 核心产品Devin定位为AI软件工程师 采用异步任务处理模式 通过Slack等平台接收指令并独立完成项目级任务[18][21][22] - 当前主要应用场景包括修复bug 执行简单功能请求 以及处理重复性任务如代码迁移 现代化改造和依赖管理[24] - 在企业级迁移场景中实测实现8-15倍效率提升 通过自动化处理周边琐碎环节大幅减少人工参与[29] - 产品采用混合体验设计 同步操作保留人类决策环节 异步处理交由AI代理执行 重点优化高影响力决策点互动[27] 业务指标与市场表现 - Devin已部署于全球数千家企业 客户范围从高盛 花旗等大型银行至2-3人规模初创公司[25] - 核心衡量指标为合并pull request占比 在成功部署团队中Devin完成30%-40%的合并请求[26] - 内部设立"初级开发benchmark"评估系统 涵盖真实工程任务如Grafana仪表盘修复和依赖调整 最新模型Claude 4.1和GPT-5在该基准表现超越前期所有模型[35][36] 行业认知与发展观点 - 认为AI编码工具发展存在十年产品进步空间 即使模型能力冻结仍可通过产品创新持续提升价值[6][55] - 提出领域成熟度理论 指出行业早期依赖直觉推理 成熟后转向数学化解决方案 类比扑克 国际象棋和游戏领域的演变过程[15][16] - 预测AI产业链各层均存在发展机会 价值将沉淀于具有显著差异化的层级 硬件 模型训练和应用层需不同专业能力[37][39] - 强调按使用量计费将成为AI经济主流模式 区别于传统SaaS按席位收费 反映GPU算力消耗的本质特征[40][41] 收购与整合策略 - 快速收购Windsurf仅用时3天完成 从周五发现机会到周一签署协议 包含不间断周末工作流程[58][59][60] - 收购动机包括获取企业工程 基础设施和市场拓展等互补职能团队 以及同步/异步产品体验的自然结合[64][65] - 收购后迅速发布Wave 11版本 实现IDE内直接访问DeepWiki 代码表示搜索和代理调用等功能集成[65] - 保持双产品哲学独立运营 同时加强Devin与Windsurf之间的体验整合 为客户提供灵活选择[67] 技术演进与未来展望 - 预测未来2-4年将出现临界点 代码不再作为主要交互界面 软件工程师角色转向架构决策和计算机模型指导[52] - 提出杰文斯悖论在软件领域具象化 认为AI工具将推动软件工程师数量增长而非减少 因存在无限软件需求[53] - 指出AI技术扩散独特性 无需硬件分发和网络效应即可实现单人模式价值交付 导致产品创新滞后于技术能力[55] - 认为AGI已以特定形式存在 但否定近期会出现断点式技术跃迁 强调现实世界问题解决需要持续迭代[56][57]
重磅!微软宣布开源Copilot!用 5000 万用户直接碾压 Cursor和Windsurf?
AI前线· 2025-05-20 09:24
微软开源GitHub Copilot - 微软在Build 2025开发者大会上宣布开源GitHub Copilot Extension for VSCode项目,采用MIT许可证,全球开发者可免费访问完整源代码并参与改进[1] - 开源计划分阶段实施:先开源GitHub Copilot Chat扩展代码库,随后将其整合至VSCode核心代码,预计6月初发布新版VSCode[4] - 开源核心理由包括:大模型能力提升使提示策略壁垒降低、AI交互体验设计趋同、VSCode开源AI生态成熟以及提升系统透明度[5] - 这一决策标志着AI开发工具从"黑盒"向"共建"时代转变,是技术成熟、生态完善等多重因素推动的结果[6] Copilot Agent功能升级 - 微软发布全新AI编码代理,可自动完成修复bug、添加功能、优化文档等任务,深度集成至GitHub Copilot[8] - 代理能自动启动虚拟机、克隆代码库并分析,实时保存改动并记录推理过程,任务完成后主动提醒开发者审查[8] - 通过模型上下文协议(MCP),代理可访问GitHub外部数据,所有GitHub数据可从官方MCP服务器提取[9] - 与Cursor和Windsurf等"氛围编码"工具不同,GitHub编码代理更侧重维护和优化现有代码库[11] 市场影响与竞争格局 - GitHub Copilot目前拥有1500万用户,是去年同期的四倍,新增代理模式功能以应对Cursor和Windsurf竞争[12] - VS Code已拥有5000万用户,开源Copilot有助于扩大分发范围并触达更多VS Code用户[13] - 谷歌和OpenAI已分别推出Jules和Codex编码代理,行业竞争加剧[10] - GitHub年收入超过20亿美元,显示AI编码工具市场持续增长[12]