Workflow
AI Programming
icon
搜索文档
“软件工程师”头衔要没了?Claude Code之父YC访谈:一个月后不再用plan mode,多Agent开始自己组队干活
AI前线· 2026-02-19 17:38
文章核心观点 - 编程正在被AI“解决”,软件工程师的角色将发生根本性转变,其头衔可能消失或演变为“建造者”、“产品经理”等,工作内容将超越写代码,涵盖撰写规格说明书、与用户沟通等更广泛的范畴 [2][122][123] - 以Claude Code为代表的AI编程工具带来了生产力革命,在Anthropic内部,工程师已实现70%至100%的代码由Claude生成,人均工程产出提升了150%,这预示着“1000倍工程师”时代的到来 [5][8][116][118] - 在AI能力指数级增长的背景下,为“六个月后的模型”而非“今天的模型”构建产品,以及保持“新手心态”并避免与模型对赌,是开发者和创始人最重要的战略原则 [6][15][110][111] Claude Code的开发理念与产品演进 - **产品起源与形态选择**:Claude Code的诞生源于探索,最初只是一个用于调用API的终端聊天程序,选择终端(CLI)形态是因为其开发成本最低、无需UI,但意外地成为最终产品形态并大获成功 [22][24][28][29] - **功能源于用户行为**:产品的核心功能(如Plan mode、CLAUDE.md、co-work)并非预先规划,而是观察并收拢用户已有的使用行为,放大其潜在需求(latent demand) [13][34][78][88] - **极致的迭代速度**:Claude Code可以一天制作20个原型,快速试错的能力比设计完美方案更重要,这种迭代速度本身就是其护城河 [15][106] AI编程对生产力与工作流的颠覆性影响 - **生产力跃升**:Claude Code推出后,Anthropic的人均工程产出提升了150%,这种量级的提升在大公司(如Meta)中需要数百人工作一年才能实现2%的提升,是前所未有的 [8][9][118] - **开发工具变迁**:在Anthropic,许多人已卸载IDE,70%-100%的代码由Claude生成,编程正从“核心能力”变为“默认能力”,未来可能不再需要IDE [5][122] - **工作流自动化**:团队使用Claude Agents SDK自动化了几乎所有开发环节,包括代码审查、安全审查、问题打标签等,实现了新型自动化 [65] 对Agent(智能体)能力演进的洞察 - **能力边界快速重写**:Agent的能力边界每几个月就会因模型升级而被重写,工程师必须不断重置对其能力的认知 [14][51] - **多Agent协作是关键**:多Agent协作(如并行sub-agent)通过测试时计算(test-time compute)和上下文隔离,能显著提升处理复杂任务的能力,这是能力放大的关键变量 [14][69][72] - **Plan mode的演进与消亡**:Plan mode的本质只是在提示词中要求“先别写代码”,未来可能自动触发甚至消失,最终用户只需一发提示词就能完成整个任务 [12][76][77][82] 给开发者与创始人的战略建议 - **为未来模型构建**:不要只为今天的模型寻找产品市场契合点(PMF),而要为六个月后模型将擅长的领域做准备,否则成果会被下一代模型能力迅速抹平 [6][21][110] - **不要与模型对赌**:增加大量“脚手架”代码可能带来10%-20%的性能提升,但下一代模型可能直接原生具备该能力,所有非模型能力最终都可能变成技术债 [12][35][111] - **拥抱新手心态与第一性原理**:在AI快速发展的时代,最重要的能力是能够承认错误、抛弃旧经验、并从第一性原理重新思考的“新手心态”,这比资历更重要 [15][54] 团队组织与人才观念的变革 - **工程师角色泛化**:在Claude Code的影响下,工程师职能正在泛化,产品经理、设计师、甚至财务同事都在写代码,未来“软件工程师”头衔可能消失,被“建造者”等更通用的角色取代 [123] - **招聘标准变化**:招聘时开始考察候选人使用Claude Code的交互记录(transcript),以评估其系统思维、测试能力等,并看重候选人承认错误并从中学的能力 [55][57] - **青睐通才与“做奇怪事情的人”**:高效工程师呈现双峰分布,一类是极端专家,另一类是跨领域的超强通才,团队更偏爱后者以及那些能以非常规方式解决问题的人才 [60][61][62][64] 行业未来趋势与影响 - **代码保质期缩短**:在快速迭代下,代码的保质期可能只有几个月,Claude Code的代码库在六个月内几乎被完全重写,重构成为常态 [12][112][113] - **Agent拓扑与协作新形态**:多Agent通过不相关的上下文窗口(uncorrelated context windows)进行协作,形成新的Agent拓扑结构,这将改变团队工作方式,例如Claude Teams的推出 [68][69] - **应用场景广泛渗透**:Claude Code不仅被工程师使用,也渗透至非技术部门(如销售、财务、设计),并被用于从恢复数据到NASA火星车航线规划等多样场景 [116][126][127][129]
速递|GitHub前CEO创办Entire,创开发工具领域种子轮融资纪录,获6000万美元融资
Z Potentials· 2026-02-12 10:27
融资事件 - GitHub前首席执行官托马斯·多姆克领投的初创公司Entire完成了创纪录的种子轮融资 以3亿美元的估值筹集了6000万美元 [1] - 本轮融资的其他投资者包括Madrona、M12、Basis Set、Harry Stebbings、杨致远以及Datadog创始人兼CEO Olivier Pomel [5] 公司背景与创始人 - 公司名为Entire 是一家开发工具初创公司 [1] - 创始人托马斯·多姆克曾担任微软旗下GitHub的CEO长达四年 于2025年8月离职并创办了该公司 在任期间见证了GitHub Copilot的崛起 [3] 产品与技术方案 - Entire提供一款开源工具 旨在帮助开发者更好地管理由AI智能体编写的代码 [2] - 技术包含三个核心组成部分:1) 与Git兼容的数据库 用于统一AI生成的代码 2) “通用语义推理层” 旨在让多个AI智能体协同工作 3) 专为智能体与人类协作设计的AI原生用户界面 [2] - 首款产品是一款名为Checkpoints的开源工具 能自动将智能体提交的每段代码与其生成背景(包括提示词和对话记录)进行配对 [2] - 工具的核心理念是让人类开发者能够审评、检索 甚至从AI的决策逻辑中获得启发 [2] 市场问题与行业背景 - 公司旨在帮助开发者应对AI编程智能体生成的海量代码 当前流行的开源项目尤其面临代码贡献建议激增的困扰 [2] - AI生成的代码质量参差不齐 可能包含设计拙劣甚至无法运行的代码 [2] - 创始人认为 行业正经历智能体爆发式增长 代码生成速度已远超人类理解能力 基于人工的软件生产体系(从问题追踪、Git代码库到部署流程)从根本上并非为人工智能时代设计 [3]
全网最详细的Codex入门教程,手把手教你玩转Vibe Coding。
数字生命卡兹克· 2026-02-09 09:30
文章核心观点 - OpenAI推出的编程代理应用Codex,特别是其搭载的GPT-5.3-codex模型,在速度、能力和用户体验上相比前代产品及主要竞争对手(如Anthropic的Claude Code)有显著提升,为非专业编程用户提供了高效、易用的“Vibe Coding”入门及进阶解决方案 [3][4][6][8][12] 产品定义与定位 - Codex是OpenAI对标Anthropic的Claude Code推出的编程代理应用,其本质是一个上层封装了工程化能力的编程Agent,由于现代信息化社会构建于代码之上,强大的编程能力使其趋近于通用Agent [14][15] - GPT-5.3-codex是一个纯粹的编程特化模型,在创作、事实核查等非编程领域效果不佳,因此未集成到面向大众的ChatGPT中,目前仅在Codex应用中可用 [16][17][18] - Codex应用提供了可视化的图形界面,极大地改善了非专业编程用户的体验,避免了使用命令行界面(CLI)或文本用户界面(TUI)时常见的反直觉操作困扰 [8] 产品性能与体验 - GPT-5.3-codex模型在编程任务上的能力被认为强于Claude Opus 4.6,并且在速度上相比前代GPT-5.2-codex有“N倍”提升,解决了之前版本因速度过慢影响使用体验的问题 [4] - 作者通过一个周末的使用,利用Codex解决了四五个过去个人无法独立完成的开发需求,并体验到进入心流状态的爽感 [6] - 在定价方面,文章对比了Claude Opus 4.6的快速模式,指出其价格昂贵,例如处理1百万令牌(1M Token)的消耗高达150美元,而OpenAI的Codex(需Plus或Pro会员)在此方面更具吸引力 [9][10] 产品功能与使用逻辑 - Codex采用“文件夹(工作区)”与“线程(Thread)”的两层结构来组织项目,文件夹用于存放代码和资料,线程用于管理围绕特定目标的独立对话和任务进程,这种设计有效避免了不同任务间的上下文污染 [26][27][28][29][31][34][36][37] - 应用内置了“定时任务”功能,允许用户设定Codex在特定时间自动执行任务,例如服务器巡检、错误处理与报告 [51][52][53] - 应用提供了可视化的“技能(Skills)”管理界面和内置的“技能创建器(Skill Creator)”,用户可以通过自然语言描述轻松创建和管理技能,简化了技能生态的构建和使用流程 [54][55][56][57] - “计划模式(Plan mode)”功能允许用户在开发大型项目前,先由AI生成详细的规划文档和实现计划,经用户确认后再进入实际开发阶段,有助于提高项目成功率 [63] - 用户可以为Codex设置全局规则(替代传统的AGENT.md文件),以指导AI在代码质量、安全规范、输出格式等方面的行为 [58][60][62] - GPT-5.3-codex提供四个推理深度等级(如High, Extra High),等级越高,模型思考越深入,结果更稳定全面,但速度更慢、成本更高,用户可根据任务难度进行选择 [64] 市场影响与行业趋势 - 编程代理(如Codex, Claude Code)的出现正在改变软件开发的逻辑,其强大的能力甚至能对华尔街等传统行业产生冲击,例如Claude的Excel协同插件曾引发市场关注 [15] - 对于非程序员而言,AI编程工具的价值可能超过对程序员的价值,因为它移除了学习编程的障碍,使得利用代码实现创意成为可能 [76][77] - 未来,使用AI编写代码可能像使用Excel一样,成为一项普遍的基本技能 [78][79]
GitHub 深夜引爆,最强Claude + Codex合体!全球 1.8 亿程序员一夜解放?
程序员的那些事· 2026-02-06 18:05
GitHub平台战略升级:集成多AI智能体 - GitHub宣布正式集成Claude和Codex两大AI编程模型,与原有的Copilot共同构成AI编程“三足鼎立”的格局[2][3] - 此次更新标志着GitHub正从一个代码托管平台,进化为多智能体协同的“AI战场”[5] - 平台通过名为“Agent HQ”的指挥中心,让开发者能够在一个指令下差遣多个AI完成编码、修Bug、提交PR等复杂任务[4][7] 核心功能与用户体验 - 开发者无需在不同工具间切换,即可丝滑完成从构思到落地的全过程,极大降低了开发中的“上下文切换”损耗[7][8][14] - 三个AI智能体(Copilot, Claude, Codex)可以在IDE(如VS Code)、GitHub网页端以及移动端被一键调用,实现了“原生”的集成体验[9][17][20] - 智能体的所有活动透明且可评审,其产出(如代码草案、修改建议)会像普通代码贡献一样呈现,自然地融入开发者的评估流程[31][33] 具体操作模式与集成 - 在GitHub上,开发者可以在仓库的“Agents”标签页输入需求并选择智能体来启动任务,任务默认异步运行并伴有详细日志[27][28][29][30] - 在Issue和Pull Request中,开发者可以@特定AI来指派任务,甚至可以同时指派三个AI处理同一问题以对比方案[32][36] - VS Code(1.109+版本)已深度集成,开发者可通过快捷键或搜索打开“Agent sessions”视图来管理智能体任务[35] - 提供三种工作模式:Local(本地快速交互)、Cloud(云端异步处理)、Background(仅Copilot后台处理),以适应不同场景[40] 对开发者和组织的价值影响 - 此次升级将开发者的工作重点从“抠语法”升华为“定策略”,使其能像“舰队指挥官”一样指挥多个专精AI(如安全、测试、重构智能体)协同工作[42][53] - 对于技术组织,该平台实现了集中管控AI权限、通过“GitHub Code Quality”评估AI生成代码质量、以及通过指标看板量化AI贡献等规模化效益[47][51] - 平台旨在接管开发者工作中约80%的重复性任务(如Bug分拣、文档更新、PR审查),从而释放创造力[53][54] - 截至2023年,GitHub开发者数量已突破1亿,目前平台拥有超过1.8亿用户,此次更新的功能已面向Copilot Pro和Enterprise订阅用户开放[11]
Moltbook“造假”刷屏,Clawdbot创始人犀利批判Agent:缺了人纯烧token、只出烂代码,没“审美”
AI前线· 2026-02-02 15:27
AI Agent社交平台与社区 - 一个名为Moltbook的AI社交平台爆火,该平台仅允许AI Agent发帖,人类只能围观,平台上有AI发帖讨论养程序bug作为电子宠物等行为[2] - 有爆料称Moltbook上50万个Agent用户可能由一个Agent虚假注册,帖子也可能是人工撰写后通过后端注入,但仍有观点认为AI在论坛上的大型互动并非全是人类表演[2] - Moltbook的诞生源于Agent开源项目Clawdbot的爆火,是开发者Matt Schlicht为了让所有Agent有个社交场所而创建的衍生创意[2] - Schlicht声称自己一行代码都没为Moltbook写过,只是提供了技术架构构想,AI将其变为现实,真正运营平台的是他自己的Agent "Clawd Clawderberg"[3] - OpenClaw创始人Peter Steinberger通过建立Discord社群,将能访问其系统所有内容和私人记忆的机器人对接上去,让社群成员直接互动,以此作为运营和收集需求的方式[4][38] OpenClaw产品功能与定位 - OpenClaw最初是一个为从手机查看电脑状态而开发的小工具,其初代版本核心是将WhatsApp与代码端对接,用户发消息即可调取二进制程序执行指令,该初代版本一小时完成[7][8] - 目前OpenClaw代码量已达到30万行,支持市面上绝大多数通讯平台,旨在成为每个人功能超强的AI伴侣,能完成用户电脑上的所有事[8] - 该工具具备强大的自动化能力,例如:自动识别推特截图、发现代码仓库漏洞、修复并提交代码、回复推文[9];自动处理未支持的语音消息,通过识别文件头、调用本地工具和API完成语音转文字[10] - 产品被描述为“挣脱了束缚的ChatGPT”,其强大之处在于获得电脑访问权限和相应工具后,能解决任何类型的问题,而不仅仅是编程[10] - 开发者为其构建了一套命令行工具体系,包括访问谷歌全功能、快速找表情包、破解外卖平台接口获取送达时间、逆向解析智能床垫API控制温度等[11] - 安装后,OpenClaw可以通过iMessage、WhatsApp、电报等通讯软件以聊天方式互动,降低了使用门槛,实现了开箱即用[15] - 该工具具有持久化记忆功能,会不断了解用户并自我更新,使用越多,定制化程度越高,能力越强[27] AI Agent对现有应用生态的潜在影响 - Steinberger预测,“手机上大约80%的应用会消失”,因为功能无限的AI助手能替代许多单一功能应用[3][26] - 具体可被替代的应用类型包括:健身打卡/饮食记录应用(AI可自动计算卡路里并提醒)[26]、智能空调控制应用(AI可直接对接API)[26]、待办清单应用(AI可主动追踪事项)[26]、航旅值机应用(AI可自动完成手续)[24][26]、购物应用(AI可根据喜好推荐并下单)[26] - 核心逻辑是,只要应用有API接口,其功能都可以由AI助手来完成,交互方式比独立应用更便捷,如同和朋友聊天[26][27] - 2024年被认为是关键一年,越来越多的人将探索AI助手用法,各大科技公司的AI助手也将更普及[27] AI编程的实践、优势与陷阱 - AI编程极大地降低了技术切换的门槛,开发者可以保留系统架构思维和技术审美,而无需纠结于基础语法和代码细节,从而更轻松地在不同技术领域间迁移[12][13] - 开发者通过直接与AI对话来迭代产品,例如将Discord社群中的用户对话截图或文字复制给AI,说“我们来聊聊这个需求”,以此作为开发新功能和修复Bug的起点[4][38][39] - 行业中存在被称为“Agent陷阱”的现象,即开发者过度沉迷于让Agent做更多事,陷入制造复杂工具(如各类钩子、技能模块、编排器)的无底洞,而忽略了创造真正有价值的产品[29][30] - 一些复杂的Agent编排器(如Gas Town)被指漏洞百出且不好用,而流行的Ralph模式(让AI循环执行小任务并清空上下文)被批评为纯粹烧token且产出代码质量差[31] - 当前AI Agent的最大问题之一是缺乏“审美”,如果没有开发者明确的愿景、良好的引导和到位的提问,最终产出可能一团糟,人的感受、思考和审美参与是做出好产品的关键[32] - 与AI有效协作是一种需要学习的新技能,需要了解其运行逻辑、推理方式,并积累沟通经验,明确需求表述(例如让AI先提问澄清需求)能大幅减少误解[34][35] - 在开发方式上,倾向于与AI进行探索性对话(“我想做这个功能,我们先聊聊”),而不是一开始就撰写详细的规格说明书,认为后者会丧失人机互动的探索过程[32][35] OpenClaw的开发模式与行业启示 - OpenClaw项目本身是100%由AI编写代码[47] - 开发过程高度依赖与AI的对话探索,而非传统的详细规划,新功能迭代的起点常源于Discord社群中观察到的用户痛点[38][39] - 开发者采用多代码仓库并行开发的模式,同时处理多个任务(如探索新功能、开发新模块、修复bug)以保持专注和高效,开发完成后在本地测试并同步到主分支[41][42] - AI编程对非技术背景人员具有赋能作用,例如,具有商务和法律背景的前公司合伙人开始提交代码合并请求(PR)[42] - 对于来自非资深开发者的PR,更倾向于将其视为需求提示,抓住核心意图后由自己重新开发或优化,而非直接合并代码[43] - 行业观点认为,2026年可能成为“Agent工程”的分水岭,对传统软件公司构成生存考验[47]
我交付的代码我自己都不读,Clawdbot冲上10万星,作者揭秘开发内幕
36氪· 2026-01-30 19:29
开源AI助手Moltbot项目热度 - 开源个人AI助手Moltbot(原名Clawdbot)成为AI圈内热度最高的项目之一,其搜索热度甚至超过头部AI玩家的类似产品Cowork [2] - 该项目GitHub星标数已突破10万大关,热度直追Next.js这样的传奇开源项目 [2] 开发者背景与创业历程 - 开发者Peter Steinberger曾创立PDF技术公司PSPDFKit,后以超1亿欧元的价格出售其股份实现财富自由 [5][12] - 其技术生涯始于十四岁,通过自学编程起步,并在早期工作中形成“使用感觉胜过行业标准”的关键判断 [5][6][7] - 在2010年前后,通过重写一款崩溃的杂志阅读器应用并自研PDF渲染器,最终将相关模块独立并发展为创业公司PSPDFKit [8] - 公司成立之初即为远程优先模式,团队规模从三十人增长至接近两百人 [9] - Steinberger长期亲自参与技术支持,通过“创始人直接支持”的方式(如5分钟内回复工单)来建立开发者信任,但这也限制了公司扩张速度 [10][11] - 随着公司进入成长期,工作重心从解决难题转向维护系统和组织协调,导致其感到精疲力竭,最终出售股份并暂时离开了技术世界 [11][12][13] AI时代软件开发的范式转变 - 软件构建的逻辑正从逐行敲击代码转向“编织式”的系统构建,AI编程成为“能力的放大器” [5][16] - 在开发新项目Clawdbot时,采用并行运行5-10个AI Agent协作的方式,开发流程从写代码转向与模型对话和共同规划 [6][16] - 开发者角色转变为系统建造者,负责系统结构、产品形态和架构取舍,而模型负责具体实现、代码生成与调试 [17] - AI编程的秘诀在于建立反馈循环,让Agent能够自动编译、测试并自行修正错误,而非期待一次性写对 [6][17] - 在AI加持下,为了让模型能够“自证正确”,系统设计变得更加模块化和可测试,反而逼出了更优质的架构 [6][18] - 开发者坦言“我交付的代码我自己都不读的”,将精力倾注于模块化设计、自动化测试和系统架构,而非具体实现细节 [6][16] AI编程工具的比较与选择 - Steinberger认为AI编程的转折点出现在今年夏天,AI已强大到无需亲手写代码就能构建完整系统 [14] - 相比Claude Code,OpenAI的产品(如GPT‑5.2和Codex)体验更好,几乎每个提示都能直接得到可用结果 [14] - 在复杂工程中,Codex明显优于Claude Code,区别在于工作方式:Claude Code速度快但需要不断纠偏,而Codex会“安静地读代码10分钟”再动手,一次成功率更高,更适合复杂系统和长期维护项目 [15] - 在Clawdbot项目中,选择使用CLI方案而非MCP,因为模型天生擅长使用Bash命令,且CLI可通过脚本实现自动化链式操作,更具灵活性 [16] 对行业现状的观察与判断 - 大量资深工程师对AI存在抵触,常犯的错误包括:把AI当作“一次性写对的程序员”、不建立持续对话与反馈循环、不了解模型的知识分布与默认假设 [18] - 反对者被类比为“仍在使用弹吉他的方式去尝试钢琴”,即未能适应新范式 [6][20] - 在AI时代,代码正在变得廉价,而对系统的判断力、对产品逻辑的品味正变得更具价值 [19] - 这场变革被视为思维的洗礼,愿意适应新工具的人有望探索出新的构建与思维方式 [20][21]
VSCode已死?从终端逆袭的Warp凭什么挑战微软和OpenAI
36氪· 2026-01-30 08:25
公司产品定位与差异化战略 - Warp是一家将传统命令行终端改造为AI时代全能开发工作台的创业公司,其核心定位是“让AI接管整个开发流程的指挥中心”,而非仅仅是“带AI的编辑器”[1][3] - 公司选择了与市场上大多数模仿VSCode的“AI IDE”完全不同的技术路径,专注于从终端深度进化,打造一个集代码编辑、编译、部署、调试、运维于一体的通用AI开发工作台[2][7] - 公司的差异化优势源于其产品基因,将IDE功能移植到终端,形成了一个能协调多个AI代理、管理服务器和处理生产事故的“瑞士军刀”式平台[7] 行业趋势与产品哲学 - 传统IDE和终端的边界正在消失,未来的开发工作台将是一个以“提示词”和“代理编排”为核心的新型界面[4] - 公司创始人认为,编程问题(即如何将需求转化为可运行代码)将在未来几年内被AI模型“解决”,未来的瓶颈将转变为人类如何精准表达意图[14][16] - 未来的开发者角色将从“代码编写者”转变为“意图表达者”和“质量把关人”,开发流程将更多地通过自然语言描述需求、审阅AI方案来完成[16] 核心技术细节与工程实践 - 公司在提示工程上面临重大技术挑战,特别是在上下文窗口管理上,采用了动态策略,包括拆分子代理、做摘要、直接截断以及结合检索增强生成技术[8] - 公司采用混合AI模型路由策略,根据延迟、成本和质量的平衡,动态切换使用Anthropic的Claude、OpenAI的GPT和Google的Gemini等多家模型[9] - 公司通过公开基准测试(如TerminalBench、SweetBench)持续评测并优化其测试框架,以提升产品性能[9] 产品能力与应用场景 - AI代理能在终端中执行复杂的多轮任务,例如在基于文本的冒险游戏“Zork”中理解游戏状态、记忆操作并根据反馈调整策略[10] - 产品已能用于实际开发工作流,例如自动生成300行代码且能直接编译通过的功能拉取请求,实现了本地编译成功率接近100%[12] - 公司展望的未来场景是AI代理能接入Slack或Linear等工具,自动响应生产环境事件(如服务器崩溃、安全告警),进行修复并提交结果供审阅,实现“后台驻留”式的自动响应[12] 商业模式与竞争策略 - 公司的定价模式从最初的订阅制(提供固定额度的AI积分)转变为更偏向按实际消费量计费的模式,以适应用户对透明度和灵活性的需求[12] - 公司直面来自OpenAI、Anthropic、Google等大厂的竞争,其生存之道在于通过深厚的技术细节(如产品基因、上下文管理、模型路由策略)构建差异化壁垒,证明其增长是可持续的真实收入增长[12][13]
凌晨三点写代码、10个 Agent 同时跑!ClawdBot 创始人自曝 AI 上瘾史:Claude Code 入坑,Codex 成主力
AI前线· 2026-01-29 16:10
文章核心观点 - AI驱动的开发范式正在发生根本性转变,资深开发者Peter Steinberger通过构建ClawdBot项目,展示了利用AI编程工具(如Claude Code、Codex)进行高效“智能体工程”的实践,其工作流、团队协作和软件架构理念与传统开发方式截然不同 [3][4][46][66] - 软件开发的核心从逐行编写代码,转变为设计可验证的闭环系统、引导AI智能体以及专注于整体架构和产品“品味”,这大幅降低了试错成本并提升了创新速度 [52][69][77][78] - 这一转变对软件行业和组织结构将产生深远影响,可能意味着未来需要更少但能力更全面的“构建者”,而传统大公司因组织边界和流程僵化,难以高效采用这种新模式 [101][102] 创始人背景与创业历程 - Peter Steinberger是PSPDFKit的创始人,该PDF框架被用于超过**十亿台**设备,他经历了严重的职业倦怠后卖掉股份,离开科技圈三年 [2][9][41] - 其技术生涯始于14岁,早期通过开发一款定价**5美元**的交友App,第一个月赚取**一万美元**,并因此决心创业 [13][15] - PSPDFKit起源于一个杂志阅读App的PDF渲染难题,Peter将其抽离为独立组件并销售,最初一周内以**200美元**的价格售出三份,随后价格涨至**600美元、800美元**,其收入很快超过他在旧金山工作的工资 [19][20][21][22] - 创业驱动力并非金钱,而是创造令人惊叹、注重细节和体验的产品,其理念是产品的“感觉”比功能列表更重要 [23][24] - PSPDFKit采用针对开发者的营销策略,通过打造卓越产品、撰写深度技术博客和参加开发者大会来建立口碑,而非侵略式销售 [27] AI编程实践与工作流变革 - Peter在2023年回归后直接使用Claude Code等AI工具,跳过了早期迭代阶段,其体验如同“赌场小老虎机”,对结果感到震撼并迅速上瘾 [46][47][49][50] - 当前工作流核心是“智能体工程”,其角色从编码者转变为“构建者”或“架构师”,同时管理**5到10个**并行运行的智能体,进行系统设计和规划 [54][62][68] - 高效秘诀在于构建“完整闭环”,让智能体能够自行编写测试、调试并验证其输出,从而确保代码质量并信任其结果 [69][70][71] - 使用AI编程要求开发者掌握新的“机器语言”,通过持续对话和反馈来引导模型,这是一种需要练习的技能 [56][75][76] - 开发过程更像迭代式“雕塑”,从一个模糊想法开始,通过快速试错(成本降至分钟级)来塑造产品,而非前期的完美规划 [77][78][79] ClawdBot产品理念与特性 - ClawdBot是一个高度个人化的AI助手,其愿景是成为理解用户上下文、情感和人际关系的“反CRM”式伙伴,类似于电影《Her》中的体验 [80][81] - 产品设计原则是将所有复杂性隐藏到“理所当然”的程度,用户通过自然聊天(如WhatsApp)与助手交互,无需感知后端的多智能体、算力等复杂系统 [84][92][96] - 其技术实现倾向于使用CLI工具而非MCP协议,因为CLI更灵活,允许模型使用如`jq`等工具进行链式组合和过滤,效率更高 [86][87][88][89] - 项目在社交平台爆火,一周内GitHub star数从**100**涨至**3000多**,并合并了**500多个**PR,Peter自嘲为“人肉合并按钮” [90][92] - 产品包含引导和“灵魂”塑造过程,通过对话生成记录用户偏好的文件(如`user.md`, `soul.md`),使交互体验更个性化 [97] 对软件工程与行业的影响 - AI编程可能显著改变公司人员结构,未来或仅需**三成**的现有人员规模,但要求成员具备高自主性、全栈产品视角和系统架构能力 [76][101][102] - 大公司因严格的角色分工和流程,难以有效采用这种新模式,这需要组织层面的深度重构而不仅是工具引入 [101][102] - 代码评审(PR)的意义发生变化,更应被视为“Prompt Request”,讨论重点转向架构决策、设计权衡和代码风格,而非逐行审查 [3][102][110] - 对持续集成(CI)的依赖降低,更重视本地的、由智能体执行的测试闭环(“full gate”),追求快速迭代 [105][107][108] - 未来的理想团队成员是活跃在开源社区、热爱技术“游戏”、具备快速学习和实验精神的全能型“构建者” [113][114][115]
代码死了!死在 Cursor 生成 300 万行浏览器的那个晚上!
程序员的那些事· 2026-01-28 18:25
Cursor CEO对AI编程(Vibe Coding)的警示性实验 - Cursor公司CEO Michael Truell进行了一次压力测试,使用数百个GPT-5.2智能体在168小时内生成了超过300万行Rust代码,目标是复刻浏览器[4][6] - 实验结果是灾难性的,尽管代码量巨大,但最终产物甚至无法顺畅加载一个谷歌首页,揭示了AI生成代码在功能上的根本性失败[7][9] - 该实验被描述为一场“名为奇迹,实为葬礼的闹剧”,是当前“Vibe Coding”盲目狂欢的缩影,并可能点燃“技术次贷危机”[3][4] Vibe Coding的本质与风险 - Vibe Coding被描述为一种“不需要懂逻辑,只需要懂「感觉」”的编程方式,但其后端逻辑充斥着AI生成的无效循环和幻觉逻辑,前端展示则幼稚且崩坏[10][13] - 允许AI无审查生成代码被比喻为签下“代码高利贷”,虽然当前开发速度可能提升10倍,但未来可能需要100倍的维护成本,技术债务极高[18][19] - AI生成的代码正将“垃圾代码”打包成看似运行完美的软件,每一次持续集成(CI)的绿灯,都在为“技术次贷”增加一笔高违约风险的坏账[20] AI编程对软件工程与职业角色的冲击 - 在AI编程时代,代码的生成成本趋近于零,但“理解代码”的成本正在指数级上升,这导致程序员角色从“架构师”降级为处理AI遗留问题的“清洁工”或“硅基铲屎官”[24][25] - GPT-5等先进模型生成的代码具有“精致伪装”,它们结构精美、注释详尽,但在核心逻辑上可能完全谬误,构成了人类智力难以穿透的“硅基黑盒”[26][27] - 当开发者不理解AI生成的代码时,会陷入“死亡螺旋”:将错误反馈给AI,AI生成新的错误,在无限递归的修正中,人类彻底丧失对代码库的控制权[33] 行业反思与正确使用AI编程的建议 - 行业风向正在转变,从追求生成速度转向强调审慎和理解,例如从Vercel加入Cursor的高管Lee Robinson的核心任务是教开发者“慢下来”[36][37] - 防止AI“幻觉”和错误生成的最强武器是官方文档,必须将最新的官方文档提供给AI工具,而不是任由其基于过时的训练数据臆造[38][39] - AI并未降低编程门槛,而是隐藏了门槛,如果开发者不懂底层语言(如Rust),AI生成的少量代码(如30行)也能将其困在调试地狱中[41] - 正确的使用方式是将AI视为“结对编程伙伴”,而非外包团队,开发者必须保持判断力,逐行审查代码,拿回对底层逻辑的掌控权[42]
“AI编程”里程碑:Claude Code“整顿”全球软件业
华尔街见闻· 2026-01-24 11:44
核心观点 - Anthropic旗下的AI编程工具Claude Code凭借其“代理(Agentic)”能力,正在引领软件开发行业进入关键转折点,从人工编写代码转向由AI全权代理,重塑工程师工作模式与行业生产力逻辑 [1] - Claude Code在商业化上取得爆发式增长,年化经常性收入(ARR)在2025年底已进一步增长至少1亿美元,成为Anthropic增长最快的业务板块之一 [1] - 基于Claude Code的成功,Anthropic正将AI代理模式向非编程领域扩张,推出新产品Cowork,试图掀起更广泛的生产力革命 [2][6] 产品与商业模式 - Claude Code的年化经常性收入(ARR)在2025年底已进一步增长至少1亿美元,此前在11月刚刚宣布ARR突破10亿美元大关 [1] - Claude Code贡献了Anthropic约90亿美元总ARR中的12% [1] - 公司计划在2028年实现现金流为正,Claude Code作为增长最快的业务板块之一将在这一目标中发挥关键作用 [7] 技术演进与产品能力 - 突破主要归功于最新AI模型Claude Opus 4.5的推出,该模型被多位开发者视为编程能力的“阶跃函数式”提升 [2] - Claude Code的核心优势在于其代理式工作模式,能够理解自然语言指令并自主完成后续开发,使用工具、读取系统文件、与Slack和Google Sheets交互 [2][4] - 从2021年到2024年,大多数工具仅能提供自动补全功能,到2025年初,初创公司开始推出早期“代理式”编程产品 [3] - Claude Code负责人个人使用该工具编写代码的比例从最初的5%,在Opus 4和Sonnet 4发布后提升至30%,而在Opus 4.5推出后的两个月里,100%的代码都由Claude Code编写 [3] 市场采用与用户行为 - Anthropic销售团队有一半人每周都在使用Claude Code [3] - 几乎100%的Anthropic技术员工都在频繁使用Claude Code,该团队95%的代码由Claude Code编写 [4] - 最高效的用户会同时启动多个任务,让Claude各自运行,然后依次检查进度,负责人本人通常会同时在终端、移动端和网页端运行五到十个代理 [4] - 企业客户在安全需求和产品交互方式上与Anthropic自身非常相似,这使得公司能够通过内部使用来优化产品 [5] - Workera在测试多款AI编程工具后最终选择Claude Code,对于公司的高级工程师而言,Claude Code的表现优于Cursor和Windsurf等竞品 [3] 行业竞争格局 - Claude Code的成功促使包括Cursor、Windsurf在内的初创公司,以及OpenAI、谷歌和xAI等科技巨头纷纷加速布局,竞相争夺AI编程市场份额 [2][7] - Cursor在去年11月宣布年化经常性收入达到10亿美元,并在12月实现了特别强劲的环比收入增长 [7] - 竞争的核心在于底层AI模型的能力,Claude Opus 4.5的推出似乎让Anthropic暂时占据优势 [7] 战略扩张 - Anthropic本月推出了名为Cowork的新产品,旨在将AI代理的功能从编程终端扩展至文件管理、软件交互等通用办公场景 [2][6] - Cowork被描述为“面向非编程人员的Claude Code”,能够管理用户计算机上的文件并与软件交互,无需接触编码终端 [6] - 负责人已开始使用Cowork进行项目管理,例如检查工程师是否填写了工作进度表,并通过Slack提醒未完成的人员 [6] - AI代理将能够处理生活中所有繁琐的事情,例如填写表格、在不同地方移动数据、发送电子邮件等任务 [6]