程序员的那些事
搜索文档
GPT-5.2 连肝 7 天,300 万行代码造出 Chrome 级浏览器
程序员的那些事· 2026-01-16 09:06
核心观点 - Cursor公司CEO对GPT-5.2模型进行了为期一周的极限压力测试,成功从零构建了一个功能完整的浏览器,展示了AI在长时、复杂任务执行上的重大突破 [2][3][5] - 该实验证明了AI具备“无中断”持续工作的能力,能够自主完成从规划、编码到调试的全流程,标志着AI正从辅助工具向能够独立承担复杂项目的“数字劳工”转变 [59][63][70] - 这一进展可能彻底颠覆软件开发的经济学,将开发周期从数月缩短至一周,并将主要成本从高昂的人力转变为可规模化的算力(Token)成本 [81][84][89] 实验概述与成果 - Cursor团队让GPT-5.2模型连续不间断运行了168小时(一周)[2][15] - 在此期间,AI生成了超过300万行代码,创建了数千个文件,并执行了数万亿个Token [4][25] - 最终成果是一个从零构建的全新浏览器,具备HTML解析、CSS布局、文本渲染及自研JavaScript虚拟机等核心模块 [5][7] - 该浏览器已能快速且正确地渲染简单网页 [8] AI模型能力对比与演进 - 传统AI编程工具(如GitHub Copilot)多为“一问一答”模式,任务长度和复杂度有限 [9][10] - Agentic编程工具(如Claude Code、Cursor Agent)实现了多步自主任务,但任务时长通常以分钟或小时计 [11][12] - 本次实验首次验证了模型可连续运行一周处理超长任务,理论上在基础设施稳定、任务明确的前提下可无限运行 [16][17][80] - 不同模型在长任务中的“耐力”差异显著:Claude Opus 4.5倾向尽早结束任务;GPT-5.1-Codex规划能力不足易中断;而GPT-5.2则能像老练工程师一样长时间专注执行 [27][28] - 长上下文窗口(如百万Token)是基础,但关键在于模型在长任务中保持一致性、专注度和执行力的能力 [20][23] 多智能体协作架构 - 实现一周内生成300万行代码的关键在于采用了多智能体系统 [34] - 初期采用平等协作模式导致效率低下,类似人类团队沟通成本过高的问题 [36][38] - 最终有效方案是模仿人类软件公司的分层架构:规划者负责探索与决策,执行者专注完成任务,评审者判断迭代是否合格 [39][42] - 该架构支持上百个智能体在同一代码库上协同工作数周,几乎无代码冲突 [40] 项目技术难度与意义 - 构建浏览器内核在计算机科学中难度极高,仅次于手写操作系统 [45] - 作为对比,谷歌Chromium的代码量超过3500万行 [47] - AI面临的挑战包括:CSS布局引擎的极端复杂性、自研JavaScript虚拟机的内存管理与安全性、以及使用Rust语言时严格的编译器检查 [51][53][55][56] - 成功完成该项目意味着AI开始具备顶级的软件架构掌控力,而不仅仅是“写得快” [58] 其他实验项目与数据 - Cursor公司同时进行的其他长时任务实验包括:Java LSP(7.4K次提交,55万行代码)、Windows 7模拟器(14.6K次提交,120万行代码)和Excel克隆(12K次提交,160万行代码)[31][34] 对行业的影响与展望 - AI实现“编写-运行-修复”的自主闭环,填平了人类工程师在复杂问题调试与重构上的传统护城河 [67][68][69] - 软件开发的主要成本将从人力和时间,转变为算力(Token)成本 [81][82] - 例如,构建浏览器项目估计消耗了约30亿个Token,而Token成本正变得越来越廉价 [85][88] - 这将导致软件开发边际成本趋近于零,可能颠覆传统的软件授权付费商业模式 [73][89] - 软件开发模式正经历根本性变革,从人类编写代码转向由AI将人类意图自动实现为复杂软件 [90][92]
Claude 版 Manus 只用 10 天搓出,代码全 AI 写的!网友:小扎 140 亿并购像冤大头
程序员的那些事· 2026-01-15 23:26
公司产品发布与定位 - 公司Anthropic发布了一款面向工作场景的通用智能体产品Claude Cowork [1] - 该产品基于公司自研的最强模型打造,定位是让非编程背景的用户也能利用AI智能体的强大能力 [2][8] - 其交互模式更像是“给一位靠谱的同事留言交办任务”,而非传统的对话 [9] 产品开发过程与效率 - Claude Cowork的开发用时极短,仅约1周半(约10天) [3] - 开发过程中,全部代码均由Claude Code编写 [3][6] - 人类开发者的角色转变为规划、设计、协调AI工作以及审核代码,而非亲自编写每一行代码 [5][29] - 开发团队组建了一个小型内部团队,设定紧迫截止日期,开发人员每人管理3-8个Claude实例来实现功能、修复错误或研究解决方案 [25] - 所有代码在合并前都会由一位人类及另一位Claude实例进行审核 [28] - 团队最终提前发布了产品,旨在尽早获得用户反馈以打造优秀产品 [30] 底层工具Claude Code的发展与影响 - Claude Code最初在2024年末作为内部测试版本(曾名Claude CLI)出现,底层模型为Sonnet 3.5,编程能力尚不成熟 [16][17] - 主要开发者最初仅将其视为原型,用作笔记工具 [18] - 该工具在内部迅速出圈,从工程师扩展到数据科学家、设计师、财务人员、销售人员、用户研究员等不同岗位 [20][21][22] - 用户将其用于编写运行SQL查询、绘制ASCII图表、制作原型、构建财务模型、分析数据、处理调查结果等广泛任务 [20][22] - 发布后,全球用户进一步将其用途拓展至控制烤箱、恢复损坏硬盘中的数据、分析DNA和医疗记录、与客服沟通等非编程领域 [22] - 正是观察到用户将Claude智能体用于大量非编程任务,团队才决定开发更易上手的Claude Cowork [23] 行业竞争与产品对比 - 有观点认为,Claude Cowork的出现可能使Meta公司花费20亿美元收购Manus的交易显得价值存疑 [11] - 另一种可能是,此次收购让Anthropic意识到了通用智能体的巨大商业价值,从而加速了类似产品的开发 [13] - 用户反馈显示,Manus目前更适用于多步骤的复杂工作流程,例如研究20家公司并整理文档,或制作幻灯片 [31] - 有观点认为当前Claude Cowork还处于较早期阶段,可被视为“拼多多版”Manus [32] 行业现状与用户提醒 - 尽管AI编码能力强大,但行业共识是代码仍然需要人工进行审查,不能百分百信任AI [33] - 赋予AI操作桌面或文件系统的权限需要高度谨慎,行业内已发生多起被AI“删库”的事件 [34] - 作为安全措施,Claude团队在授予文件系统权限时,使用了“危险地跳过许可”这样的命令参数以警示用户 [36]
西贝突然关 102 家店!贾国龙急了:不是预制菜,是被网红坑了。网友:还在嘴硬?
程序员的那些事· 2026-01-15 21:13
以下文章来源于算法爱好者 ,作者小蒜 算法爱好者 . 算法是程序员的内功!「算法爱好者」专注分享算法相关文章、工具资源和算法题,帮程序员修炼内 功。 1 月 15 日,网上流传"西贝初步规划关闭 102 家门店"的消息。消息称西贝于 1 月 11 号在呼和浩特基地开 会,初步规划关闭全国 102 家门店,覆盖超 30 个城市。 | 切步沟通闭店102家门店,清单如下 序列 所在博士 所在城市 印度 | | | | | --- | --- | --- | --- | | | 原创业分部 | 内容 | | | b HOR 9 | | | 保障用明生建议 | 15 日下午, 贾国龙 在朋友圈发文回应称,"(网上)截图信息基本是准确的,遭到了铺天盖地的污蔑 125 天"。 贾国龙强调西贝门店从不用预制菜,称是网红恶意混淆了 "中央厨房备菜" 和 "料理包预制菜" 的概念 ,还恶 意诋毁西贝的急冻保鲜有机西兰花以及进价高的草原羊等食材。他直言自己不懂公关,西贝能连续 11 年蝉联 中式正餐营收第一,靠的是多年来的服务品质,而非公关手段。 "嗯嗯,西贝不是预制菜,继续作,大大方方承认不好吗,我之前也经常吃,后来觉得价格高 ...
“死了么”App突然下架!创始人:被要求下架的
程序员的那些事· 2026-01-15 21:13
公司事件与运营状况 - 公司旗下“死了么”APP于近期被要求下架 开发者回应称是“被要求下架的”但未透露具体原因 [1] - 该APP自2025年6月上线以来 已累计发生一次下架与三次清榜 具体时间点为2025年6月28日 9月20日 12月12日及12月15日 [3] - 该APP近期因下架事件引发高度关注 在三天内经历了上架 改名 下架的全过程 [3] 行业监管与合规环境 - 市场猜测APP下架原因可能涉及未完成合规备案流程 公司或为规避处罚而主动下架 [3] - 苹果App Store的清榜机制由算法风控与人工审核双重触发 主要原因包括恶意刷量或操控排名 评价违规 数据异常误判以及合规或质量问题 [3]
“在携程帝国面前,其他互联网大厂都是弟弟”
程序员的那些事· 2026-01-15 14:25
事件背景与市场反应 - 2025年1月14日16:00,官方发布对该公司涉嫌垄断被立案调查的消息,引发网络热议[1] - 该公司于当日17:00回应称将积极配合调查[1] - 截至1月15日早晨,微博科技热搜Top50话题中有12个与该事件相关[1] - 网络舆论普遍反映“天下苦携程久矣”,并称其为“携程帝国”[1] 市场垄断地位 - 2024年,该公司在酒旅GMV市场的占有率达到56%[3] - 加上其控股的同程旅行,“携程系”合计市场占有率接近70%[3] - 主要竞争对手美团和飞猪的市场占有率分别为13%和8%[3] - 这种一家独大的格局在互联网垂直赛道中较为少见[3] 财务表现与盈利能力 - 2025年第三季度,公司净利润为199亿元人民币[3] - 以此计算,公司日均净利润约为2.16亿元人民币[3] - 公司净利率高达34%,令众多互联网公司难以企及[3] - 公司是《财富》中国500强净利率前十名中唯一的互联网公司[3] - 具体净利率为32%,排名第七位[4] - 其他互联网大厂如腾讯、拼多多、网易的净利率分别为29.4%、28.5%、28.2%,均未进入前十[4] 对商家的控制与争议行为 - 公司凭借流量优势,对商家拥有强大的控制力[4] - 有云南民宿老板反映,基础佣金率为12%-15%,叠加推广费用后实际成本超过30%[4] - 公司被指强制要求商家“二选一”,若不选择独家合作则会遭遇流量屏蔽[4] - 郑州、贵州等地的监管部门曾就强制调价问题约谈过公司,但未能阻止其垄断行为[4] - 2025年11月,云南民宿协会公开征集OTA平台不正当竞争证据,直接针对该公司等个别平台,为后续反垄断调查做了铺垫[4] 事件关联与舆论 - 在本次立案调查前,公司曾因“误发全员离职信”登上热搜[4] - 被调查后,有网友调侃此前的“误操作”是在预演当前局面[4]
电脑开机要先闯关?程序员10个月用C语言爆肝5款神作,赢不了直接关机,网友:越折腾越上头
程序员的那些事· 2026-01-15 14:25
项目概述 - 一位名为mycroftsnm(简称Armas)的开发者,花费大约10个月时间,用C语言开发了五款运行在UEFI启动阶段的小游戏,将电脑开机过程变成了必须通关的挑战 [1] - 该项目名为「UEFI游戏合集」,已在GitHub上开源,迅速吸引了大量技术爱好者围观与讨论 [2] - 游戏的核心规则是:玩家赢了游戏,系统正常启动;输了游戏,电脑有时会“嘲讽”一句后当场关机 [2] 技术原理 - 游戏运行于UEFI阶段,UEFI是现代电脑中BIOS的继任者,是开机后的“第一管家”,负责在操作系统启动前检查硬件和分配资源 [4] - 与老旧的BIOS相比,UEFI更模块化、更安全、更灵活,支持图形界面和鼠标操作,并能直接运行简单程序,开发者正是利用这些能力在操作系统加载前构建了游戏体验 [5][6] - UEFI应用在操作系统启动前运行,拥有更高权限,可以直接调用电源管理功能,从而实现游戏失败后强制关机的效果 [35] - 运行这些个人开发的未签名UEFI程序,通常需要满足特定条件,例如关闭安全启动、手动注册自定义密钥或在支持开发者模式的电脑上运行,这可能会降低系统的安全性 [35][36] 游戏详情 - **User Evaluation for Ineptness(用户无能评估测试)**:开机后需计算两个0到99之间随机数的和,输入错误答案会触发系统嘲讽并直接关机 [8][9][10] - **Insult Sword Fighting(侮辱剑斗)**:灵感来自经典游戏《Monkey Island》,玩法为“回怼对决”,玩家需从选项中选出正确的回怼语句来回应系统的挑衅,台词库可通过编辑文件自定义 [14][15][16][18] - **Fall To Boot(坠落开机)**:玩家操控星形光标在程序化生成的纵向隧道中快速下坠并避开墙壁,反应不及导致撞墙会直接关机,且没有重试机会,是Reddit上讨论度最高的游戏 [20][22][23] - **Age Verification(年龄验证)**:灵感来自《Leisure Suit Larry》,通过80年代流行文化问答来验证用户是否“成年”,答错则系统拒绝启动 [26][27] - **UEFI Says**:唯一一款图形界面游戏,玩法类似“西蒙说”,考验短期记忆力,玩家需记住并重复屏幕上随机点亮方块的颜色顺序,顺序会越来越长,答错直接关机 [29][30][31] 社区反响与观点 - 项目在GitHub和Reddit上引发热议,社区观点主要分为“支持派”与“吐槽派” [38] - **支持派观点**:认为这是一种“安全+趣味双赢”的方案,比传统密码更灵活有趣,相当于为电脑增加了一层别致的安全防护;同时赞赏其创意,将枯燥的开机过程变成了乐趣 [39] - **吐槽派观点**:认为这在紧急工作场景下(如上班开会)会带来不便,可能导致心态崩溃或被误解为摸鱼;同时担心关闭安全启动会带来安全风险,让恶意软件有机可乘 [39] - **其他脑洞建议**:网友提出了分阶段发布并强制更新、增加地狱难度(如失败后格式化硬盘或删除内核)、开发多人对战模式等创意想法 [40][44] 项目定位与影响 - 从实用角度看,该项目更像是一次“技术可能性的展示”,而非推荐所有人安装的实用方案,因为它需要权衡系统安全性 [37] - 开发者指出,玩家若无法通关,可以通过按特定按键(如F11)直接启动引导程序来绕过游戏,因为游戏本质上只是一个被设置在启动顺序首位的EFI可执行文件,此设置可以随时撤销 [41] - 该项目虽然可能永远不会成为主流启动方式,但它展示了在程序员眼中,即使是开机这样的基础过程也存在着无数的创新玩法,这种“为了好玩”的探索本身具有价值 [43]
趣图:做一个“银行万能钥匙”,没钱时打开 APP,自动搜索附近银行,自动登录存储最多的账号,然后…
程序员的那些事· 2026-01-15 07:52
不得不说,这个 idea 可真刑! 和之前这期趣图,纯纯一个系列啊:《 做一个APP,接入微信支付,主要功能仿摇一摇,只要用户摇一 下,他的微信零钱都… 》 大家还遇到过哪些极品需求,欢迎留言分享。 "模仿 WiFi 万能钥匙的思路,开发一个银行万能钥匙。没钱时打开 APP,自动搜索附近银行,自动登录存 款最多的账号,可任意提款转账" ...
马斯克宣判:再见,程序员!奇点就在 2026
程序员的那些事· 2026-01-15 07:52
文章核心观点 - Claude Code的卓越编程能力引发行业震动,被多位科技领袖视为技术奇点临近的标志,预测奇点可能提前至2026年 [1][3][7][12] - 以Claude Opus 4.5为代表的先进AI编码模型正引发软件开发范式的根本性变革,将极大提升生产效率并可能重塑软件工程行业 [25][26][35][60] 技术奇点与行业预测 - 技术奇点指技术增长在临界点后呈指数式加速,此前预测多在2045年,但当前进展可能将其大幅提前至2026年 [9][10][11][13] - 行业领袖如马斯克断言“我们已进入奇点”,并将2026年称为“奇点之年” [3][7] - 哲学家戴维·查尔默斯的理论模型(AI到AI+再到AI++的阶跃)指出,当AI能设计出更强的AI时,将引发“智能爆炸”,当前发展正符合此逻辑推演 [44][45][46][48] Claude Code的性能与市场影响 - Anthropic推出的Claude Opus 4.5被宣称为全球最顶尖的编码模型,其与Claude Code联动使用使平均效率暴增220% [25] - 在最新LiveBench榜单中,Claude Opus 4.5以76.20的全球平均分登顶,碾压GPT-5.1 Codex MAX(75.63)和Gemini 3 Pro Preview(75.22)等竞争对手 [28][31] - 该模型在自主编码任务中能连续运行5小时不崩溃,是公开AI模型中完成长程任务时间最长的 [32] - AI大佬认为以Opus 4.5和GPT-5.2为转折点,模型已跨越隐形能力界限,大量编码难题被解决 [34][35] 软件开发范式的变革 - 谷歌工程师表示其70%-80%的代码已由AI编写,工作角色转变为“代码审查”,核心工作变为用提示词定义逻辑、审查AI修改建议、让AI解释遗留代码 [50][51][52] - AI被视为效率倍增器而非简单替代品,生产力标准被整体抬高,拒绝使用AI意味着落后 [54][55][56] - OpenAI CEO奥特曼预测“用不了多久,每个人都会成为软件工程师”,自然语言将成为新的编程语法 [60][63] - 未来,AI智能体可能直接“住”在代码库中,自动浏览仓库、修复bug、补充测试、重构代码并提交修改 [64] 对生产效率与职业路径的影响 - 非专业程序员(如生物医学工程师)为更频繁使用Claude Code而升级订阅 [18] - 行业人士认为,若有当前强大工具助力,原本需5.5年完成的博士研究可能缩短至1年 [59] - 软件开发自动化被视作第一块倒下的多米诺骨牌,其逻辑将蔓延至运营、规划及部分管理工作 [65] - 随着AI编码能力的发展,“学会写代码”本身的重要性可能下降 [66]
被骂惨了吧?“死了么APP” 撤回改名,但是…
程序员的那些事· 2026-01-14 23:59
"名字是产品的灵魂" ,谜底就在谜面上啊! (╯‵□′)╯︵┻━┻ PS:这(些)个开发者,还挺会熬夜搞事情的 什么鬼?睡前刷到「死了么APP征名」的热搜。 昨晚还说在启用 Demumu ,今晚又要征集名字?果然被骂惨了 ...
“同事加班猝死,1 个月后就被遗忘”!40+岁大厂老程序员主动被裁:年薪百万常春藤毕业,却被彻底榨干
程序员的那些事· 2026-01-14 12:11
文章核心观点 - 文章通过一位拥有25年经验的前科技巨头工程师(ADE)被裁员的个人经历,深度复盘了科技行业的变迁、高薪背后的职业代价以及对当前年轻技术人才就业环境的观察与建议[1][3][20] 行业环境与就业市场变迁 - 过去的科技行业是工程师凭“硬实力”就能出头的时代,如今应届生面临的职场环境与当年相比已是天壤之别[10][20] - 当前人才市场供大于求,企业更愿意将预算花在技术基建而非扩招新人,导致入门级岗位严重缩水[20] - 行业宏观因素如AI工具普及、外包成本更低,大幅降低了大厂雇佣本土员工的意愿,引发一波又一波的裁员潮[17] - 行业被形容为一台“浪费人才的机器”,埋没了整整一代聪明又有才华的工程师[20] 科技公司的职业特征与代价 - 科技行业提供高额薪酬,职业生涯大部分时间可拿六位数的年薪,跳槽至大厂后收入迎来爆发式增长,限制性股票单位(RSU)和股票期权等福利叠加的收入规模被形容为“荒谬”[13] - 行业工作强度高,加班是家常便饭,全球化团队导致工作时间从早到晚被拉长,严重挤占个人与家庭时间[15] - 技术迭代速度快得惊人,必须保持终身学习状态以不被淘汰,但资深员工会明显感觉到学习速度“变慢”[15] - 许多项目被参与者认为在反复解决同一问题,缺乏解决重大难题或让世界变得更好的意义感[15] - 公司对员工的替代性极强,同事离世后仅一个月便仿佛从未存在过,揭示了个体对公司而言“只是一个工号”的现实[16] 对技术从业者的职业建议 - 选择职业应忠于内心,如果仅为高薪或外界期望而入行,最终可能留下遗憾[21] - 在校期间应主动打造个人影响力与“硬背书”,例如为学校或非营利组织写系统、为知名开源项目贡献代码、参加黑客松并获奖、在技术Meetup上做分享[22] - 应把实习视为头号任务,它能显著提高获得全职offer的概率,远超海投简历[23] - 若未获得实习机会,需全力打磨简历、刷熟LeetCode和HackerRank算法题并进行模拟面试[24] - 求职不应只盯着“软件工程师”,可考虑QA工程师、数据工程师、销售工程师、DevOps工程师等“相邻技术岗”作为入行跳板,再寻求内部转岗[25] - 需保持灵活并拥抱变化,若无法进入大厂全职岗,可尝试合作项目、接外包、做独立开发者或启动小项目,也可考虑去其他城市寻找机会[26]