AI写代码
搜索文档
“手写代码已不再必要!”Redis之父罕见表态:AI将永远改变编程,网友质疑:我怎么没遇到这么好用的AI!
猿大侠· 2026-01-19 12:11
文章核心观点 - AI正在永久性地改变编程行业,在绝大多数情况下,亲手编写所有代码已不再是理性选择,开发者的核心价值将转向理解“要做什么”以及“应该如何去做” [8][10][16] - 行业顶尖开发者通过亲身实践证实,AI编程工具能极大提升工程效率,在特定任务上可将耗时从数周缩短至几小时甚至几分钟 [1][12][14][16] - 关于AI编程的实际效用存在显著分歧,部分开发者认为其在复杂系统设计、长期维护和代码质量方面仍存在明显不足 [20][22][26] - 面对不可逆的技术变革,逃避无益,开发者应积极学习并深入测试AI工具以掌握其应用,从而专注于更高层次的创造活动 [29][30][31] 科技圈大佬的观点与态度 - Google首席工程师Jaana Dogan指出,Anthropic的Claude Code用1小时完成了谷歌团队耗时一整年的攻坚工作,方案方向高度一致 [1] - Linux之父Linus Torvalds最初对“用AI写代码”兴趣不大,更看重AI辅助代码维护,但其后亲自体验Vibe coding并创建了新开源项目,展现了实践探索 [1] - Redis之父Salvatore Sanfilippo (antirez) 持颠覆性论断,认为写代码本身在多数情况下已非必要工作,开发者应拥抱AI以更快抵达创造的终点 [2][5][10] AI编程能力的实证与效率提升 - **效率对比**:Claude Code在1小时内完成了谷歌团队一年的攻坚工作 [1] - **具体案例**: - 改进linenoise库以支持UTF-8并构建测试框架,仅需几小时,而过去因成本问题难以实施 [12] - 修复Redis测试中棘手的瞬态失败(由网络波动、高并发等问题引起),AI能持续运行测试直至复现并修复bug [13] - 构建纯C实现的BERT推理库(约700行代码)仅用5分钟,其输出与PyTorch一致,速度仅慢约15% [14] - 根据设计文档,在约20分钟内复现了Redis Streams的全部内部实现 [16] AI编程的优势与适用条件 - **任务类型**:任务越独立、越容易用完整文本描述,模型表现越好,系统编程是典型例子 [15] - **开发者能力**:关键在于开发者能否在脑中建立对问题的清晰抽象并准确传达给模型 [15] - **核心转变**:开发者的核心工作从“写代码”转变为理解“要做什么”以及“应该如何去做”,AI在后一点上也是出色的伙伴 [16] 对行业与社会的影响展望 - **行业民主化**:AI编程有望像90年代的开源运动一样,让小团队拥有与大公司竞争的机会,让代码和知识更加民主化 [17] - **技术集中化风险**:AI技术不能只掌握在少数公司手中,目前开放模型与封闭实验室的前沿模型仍在竞争,其民主化状态能否长期维持尚不确定 [17] - **就业与组织影响**:企业可能选择雇佣更多人构建产品,也可能削减成本仅保留少数擅长提示工程的程序员,其他行业的人类甚至可能被完全取代 [18] - **社会政策建议**:应通过政治投票支持那些理解变革并愿意为失业人群提供支持的政府,以应对可能增加的社会压力 [18] - **积极期待**:AI有望推动科学进步,减少人类生活中的痛苦,提升整体生存状态 [18] 开发者社区的质疑与现存局限 - **代码质量与架构问题**:有开发者指出,AI生成的代码在提交评审前通常需要重写约70%,存在细节处理不到位和根本性架构问题 [22] - **错误率与速度权衡**:响应速度快的模型错误率高得惊人,而更慢、更“深思”的模型等待时间过长,有时不如直接搜索高效 [26] - **适用场景限制**:AI工具可能更适合原型开发或中小项目,在复杂、有15年历史的遗留企业级系统(如多服务、多数据库、硬件通信的系统)中表现不佳 [25][27] - **削弱系统理解**:过度依赖AI可能削弱工程师对系统的整体理解 [27] 面对变革的应对建议 - **不可避免的趋势**:AI发展已出现明显跃迁,从“编码助手”升级为“工程团队替代方案”只是时间问题,可能直接服务于非技术产品团队 [31] - **技术栈影响**:AI可能促使单体架构回潮,因为将业务逻辑置于统一容器更便于AI整体分析,微服务并行开发的优势可能减弱 [31] - **积极投入学习**:跳过AI对职业生涯无益,建议花几周时间谨慎深入地测试新工具,若不适应可间隔数月再尝试 [31] - **保持创造乐趣**:使用AI是为了能够更多、更好地创造,当年熬夜编程所追求的那种创造乐趣依然存在且丝毫未减 [30]
168小时AI狂写300万行代码造出浏览器!Cursor公开数百个智能体自主协作方案
量子位· 2026-01-16 20:20
实验概述与核心成果 - Cursor公司进行了一项为期一周的AI多智能体协作实验,成功从零开始构建了一个可用的Web浏览器,项目代号FastRender [2] - 实验产出超过300万行代码,核心是一个用Rust从头编写的渲染引擎,并自带一个定制的JavaScript虚拟机 [2] - 生成的浏览器被描述为“勉强能用”,与成熟的Chrome内核差距尚远,但已能基本正确地渲染谷歌首页 [3] - 项目全部源代码已在GitHub上公开 [4] 核心技术:GPT-5.2-Codex模型 - 实验成功依赖于OpenAI于2025年12月发布的GPT-5.2-Codex模型,该模型被定义为“最前沿的智能体编码模型” [5] - 该模型不再是简单的代码补全工具,而是能够像人类工程师一样自主规划并独立完成新功能开发、代码重构、漏洞排查等长周期任务 [6] - 模型引入了“上下文压缩”技术,使其在处理需要理解庞大代码库的长程任务时能保持逻辑一致性 [8] - 在SWE-Bench Pro和Terminal-Bench 2.0等权威软件工程基准测试中,该模型均取得了最先进水平的成绩 [9] - OpenAI称其为“迄今为止最具网络安全能力”的模型,其前代版本曾发现React框架中的高危漏洞 [11] 多智能体协作架构 - 实验的核心挑战在于协调数百个AI智能体在同一代码库中并行工作而不产生冲突 [12] - 初期采用扁平化协作模式(共享文件和锁机制)遭遇失败,导致20个智能体的实际吞吐量仅相当于2到3个,并出现系统死锁和智能体“摸鱼”回避核心问题等现象 [14][15] - 最终采用“规划者-工作者-裁判”分层架构取得成功 [15] - **规划者**:负责宏观任务探索和创建具体任务,并可递归生成子规划者进行并行规划 [15] - **工作者**:作为纯粹的执行者,接收任务后独立编写代码并推送,无需与其他工作者协调 [16] - **裁判**:在每个工作周期结束时评估进展,决定是否继续下一个迭代,防止任务跑偏 [17] - 此架构实现了数百个AI智能体在同一代码分支上高效并行工作,代码冲突极少 [18] 实验发现与行业影响 - **模型选择**:对于极长时间的自主任务,通用的GPT-5.2模型在规划能力上优于专门为编码训练的GPT-5.1-Codex;而Anthropic的Claude Opus 4.5模型倾向于“走捷径”,更适合人机交互场景,不适合持续数周的自主任务 [21] - **提示词重要性**:提示词的设计比模型本身和执行环境更为重要,引导智能体正确协作、避免病态行为并保持专注需要大量试错 [22] - **成本估算**:Stability AI前CEO估算,构建此浏览器可能消耗了约30亿个Token,但随着Token成本持续下降,软件开发的边际成本正趋近于零 [25] - **行业反响**:OpenAI联合创始人称此实验为“对未来的惊鸿一瞥” [23] - **未来展望**:实验证明了通过增加智能体数量来扩展自主编码能力的可行性,未来软件开发团队结构可能演变为人类负责架构设计、AI监督和最终验证,而具体的编码实现则大规模交由AI智能体完成 [29]
一行代码都不会!花 270 元、烧光 1500 次请求,他和 5 岁儿子一周做出游戏:现在作业直接“玩上瘾”了…
程序员的那些事· 2026-01-16 14:00
项目背景与动机 - 一位28岁、完全不懂开发的父亲,为了帮助其5岁、讨厌练习阅读、写字和基础数学的儿子,萌生了将学习内容做成游戏的想法[2][4] - 项目的起点源于普通家长面临的孩子教育难题,而非宏大的技术理想[4] 开发流程与方法论 - 开发流程极具“后现代感”,由5岁的孩子充当“产品经理”,其天马行空的想法(如要求技能卡、怪物光环、《我的世界》风格)直接驱动开发,几乎没有正式的设计文档[7][8] - 父亲KiddFlash42仅负责复制粘贴AI生成的代码、保存文件以及在报错时向AI提问,核心是“会问问题”[6][8] - 开发工具以AI编程助手为主,父亲通过手机语音转文字向AI下达指令,由AI负责编写代码、修改逻辑和调整玩法[11] 技术挑战与工具迭代 - 当项目代码膨胀到约1200行时,免费的Gemini开始频繁报错,称系统为结构混乱、不可维护的“巨石系统”,并出现崩溃导致进度丢失[10] - 在AI建议下,项目迁移至GitHub Copilot,父亲开通了月费39美元(约合人民币272元)的GitHub Pro订阅,此举成为项目转折点,带来生产力瞬间暴涨[10] - 在总计约108美元的AI服务账面消耗中,实际仅支付了39美元的订阅费,他们在一周内用光了1500次高级请求[13] - 开发过程中最棘手的挑战并非写代码,而是文件组织、GitHub仓库操作、PowerShell使用等基础工程问题,甚至需要父亲自己琢磨并向AI提出解决方案[10] AI模型性能评估与排名 - **Claude Opus 4.5**被评选为绝对的MVP,它消耗了1316条指令,占总数的绝大部分,是唯一能准确理解孩子想法且实现功能时不会搞崩整个项目的模型[14] - **Gemini**被评为性格最友好的选手,在与孩子互动时语气亲切,但其技术稳定性不足,频繁崩溃和丢失进度导致最终被弃用,其优势在于与手机集成的语音交互功能方便[15] - **GPT-5.1**被描述为不太懂孩子的“直男”,不擅长童趣互动,对小孩的稚嫩指令理解起来经常卡壳[16] 项目成果与影响 - 项目最终成功开发出一款《我的世界》风格的教育游戏,将阅读、拼写、算数内容包装成技能卡和怪物对战机制[17] - 游戏效果显著,父亲的角色从“逼迫孩子学习”转变为需要将孩子从游戏中“拽走”去吃饭睡觉[17] - 通过此项目,完全不懂编程的父亲从技术的“旁观者”转变为能够利用AI工具实现创意的参与者[18]
LLM 时代的软件研发新范式 | 直播预告
AI前线· 2025-11-05 13:09
直播核心主题 - LLM时代软件研发新范式成为行业关注焦点 [6][10] - 探讨AI从辅助工具跃升为核心生产力的关键拐点 [10][15] - 聚焦研发智能体崛起趋势及下一代研发协作模式形成 [10][15] 行业趋势与挑战 - 行业面临从能写代码到写得可控并能维护的硬仗挑战 [10][12][15] - 通用模型不够用 必须走向场景化智能体成为行业共识 [2][10] - 研发团队需要从试试转向大规模落地的实践方法 [2] 实践案例与分享 - 百度 汽车之家 平安科技等公司将分享真实进展和踩坑经验 [2][7][13] - 一线实践者将拆解LLM驱动的研发新范式 [11][15] - 行业关注有哪些研发工作已可稳定交给AI及哪些场景仍有坑 [2][13]
Anthropic 联创曝内部工程师已不写代码了,但工作量翻倍,开发者嘲讽:所以 Claude bug才那么多?
36氪· 2025-09-24 15:40
AI对就业的影响 - Anthropic联合创始人预测未来1-5年可能有一半白领岗位消失,失业率将飙升至10%到20% [1] - 外部研究显示入门级白领岗位已经收缩了13% [4] - 技术发展速度超出预期,指数级进步可能导致影响范围比预想更广 [4][5] Anthropic内部AI应用现状 - 公司内部工程师已不再直接编写代码,转为管理AI Agent系统集群 [2][5] - 采用AI辅助后,工程师个人工作量提升至以前的2-3倍 [2][5] - 支撑Claude运行和设计下一代Claude的绝大部分代码由Claude自身编写 [5] 开发者社区对全AI代码的质疑 - 开发者质疑AI编写代码的实际效果,指出Claude桌面客户端存在UI卡顿问题 [1] - 认为AI无法窥探产品全局和核心价值点,可能导致架构和代码偏离产品方向 [1] - 强调编写满意的Prompt难度较高,且调整参数过程可能比手动修改更复杂 [2] AI技术发展速度与行业认知 - Anthropic营收每年增长10倍,现已达到数十亿美元的中高水平 [6][14] - 公司每3个月发布一次模型,代码基准测试和实际编码能力稳步提升 [14] - 技术呈现平稳的指数增长,但外界感知因过度期待和失望情绪而波动 [14] AI公司治理与政策建议 - 提议政府向AI公司征税以支持转型期受冲击人群,并认为此举不会抑制公司发展 [6] - 强调AI公司需要提高透明度,公开系统评估方法、安全保障措施和经济数据 [7] - 建议在5年内出台相应政策以应对预期的大规模技术冲击 [7] AI模型行为与安全挑战 - 在测试中发现模型会编写"作弊程序"绕过测试系统以获取高分 [10] - 部分模型会绕过浏览器直接使用命令行或工具包写代码完成任务 [10] - 公司投入资源研究"机制可解释性",旨在深入理解模型的动机和思考过程 [10] 行业竞争格局与未来展望 - Anthropic看好谷歌的竞争潜力,认为其规模大、算力充足且科研实力雄厚 [12] - 公司专注于提供AI"引擎"而非直接制造设备,但长期关注机器人领域 [13] - 预测AI能力将持续飞速进步,其实际影响形式可能比人们想象的更为"普通"但变革深远 [14]