Vibe Coding
搜索文档
3000亿港元AI巨头发力AI编程 公开GLM-5技术细节
搜狐财经· 2026-02-24 14:00
资本市场表现与市场地位 - 智谱股价在2026年开年表现强劲,单日涨幅超过15%,市值突破3000亿港元 [1] - 春节后港股首个交易日(2月20日),公司市值一度攀升至3232亿港元,超越京东、快手等传统互联网巨头,跃居港股TMT板块市值第一梯队 [1] - 根据OpenRouter最新周度数据,平台前十模型总token调用量约8.7万亿,其中中国模型独占5.3万亿,占比61%,当周token调用量前三的模型均为国产大模型 [1] 技术突破与模型性能 - 智谱发布的GLM-5大模型在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面,全面超越此前所有开源基线模型 [1] - 在全球权威的真实编程任务评测SWE-bench Verified中,GLM-5取得了77.8%的高分,位列开源模型第一,多项指标直接对标闭源天花板Claude Opus系列 [8] - 硅谷顶级风投机构a16z将GLM-5与闭源模型Claude Opus系列对标,并在其行业报告中指出,开源大模型与顶级闭源模型之间的能力差距正在快速收窄 [2][8] 核心技术创新与架构 - GLM-5实现了四大技术突破:Slime异步强化学习基建、AgentRL异步智能体强化学习算法、DSA稀疏注意力机制以及全栈国产芯片适配 [23] - AgentRL是中国原创核心算法,适配复杂长程交互学习,是GLM-5超越开源基线的关键 [23] - DSA稀疏注意力机制结合MoE架构,在保留200K超长上下文能力的同时,大幅降低长序列计算与推理成本 [23] - 模型完成了与华为昇腾、摩尔线程等七大国产算力平台的全栈深度优化,单节点性能媲美双GPU集群,长序列处理成本降低50% [23] 行业范式转变:从氛围编程到智能体工程 - GLM-5的核心定位是推动全球AI编程范式从“Vibe Coding”(氛围编程)全面转向“Agentic Engineering”(智能体工程) [4] - “Agentic Engineering”由前特斯拉AI负责人、OpenAI创始成员Andrej Karpathy提出,正成为全球AI产业的核心竞争赛道,该技术通过标准化工程体系,将具备自主规划、执行、纠错能力的AI智能体转化为可稳定落地的企业级生产力工具 [4] - 行业主流AI编程此前处于“Vibe Coding”时代,AI本质上是程序员主导的辅助工具,难以处理长周期、多步骤的系统性工程任务 [7] - GLM-5将AI推向“Agentic Engineering”新时代,AI能够作为“虚拟工程师”自主承担端到端软件工程,完成需求拆解、架构设计、代码编写、调试迭代、项目维护等全流程开发任务 [7] 实测验证与应用场景 - 记者实测要求GLM-5从0到1创建名为「MonoGlass Gallery」的个人摄影作品集网站,模型在数分钟内便完整生成了适配专业作品集网站的全页面设计与可部署前后端代码 [12][16] - 在企业级MLOps架构规划实测中,GLM-5以资深MLOps架构师身份,完成了云原生编排与传统容器化方案的对比分析,并输出包含工具评估、部署路线、风险评估的Excel工作簿,对复杂技术需求的拆解能力表现突出 [18][20][21] - 在正式发布前,GLM-5的匿名测试版本Pony Alpha已在海外开发者社区OpenRouter登顶热度榜,开发者发现其能在完全无人干预的情况下,自主读取复杂错误日志、跨文件修复底层代码漏洞,甚至耗时数天从零构建出可用的C语言编译器 [7] 行业竞争格局与影响 - 在智能体工程领域,以智谱为代表的国内创业企业已在核心技术与开源生态上形成局部突破,在垂直场景落地方面展现出显著优势 [2] - 中国企业正成为Agentic Engineering领域全球第二大创新极,国内头部互联网大厂已完成全栈技术布局,以智谱为首的多家创业公司在核心技术、开源生态上实现局部突破 [5] - GLM-5的出现改变了全球大模型市场格局,此前只有闭源头部模型敢触碰的Agentic Engineering领域,如今被开源的中国模型率先突破 [8] - Agentic Engineering领域全球产业格局已初步成型,微软、OpenAI、谷歌DeepMind凭借全栈技术布局与行业标准定义权稳居头部,Anthropic、英伟达等企业在细分领域领跑 [4]
Twilio: Consistent Growth And Rising Cash Flow (NYSE:TWLO)
Seeking Alpha· 2026-02-13 23:09
文章核心观点 - 2026年对软件股而言是灾难性的一年 投资者正在权衡人工智能和氛围编程能否打破企业软件的壁垒 [1] 作者背景 - 作者加里·亚历山大拥有在华尔街报道科技公司以及在硅谷工作的综合经验 并担任多家种子轮初创公司的外部顾问 因此对当前塑造行业的许多主题有深入了解 [1] - 自2017年以来一直是Seeking Alpha的定期撰稿人 其文章被引用在许多网络出版物中 并被同步到如Robinhood等流行交易应用的公司页面 [1]
OpenClaw 技术闭门:测试将比代码更值钱,Agent Computer 会是新的硬件形态
Founder Park· 2026-02-13 20:17
OpenClaw项目引发的行业变革与真实应用 - OpenClaw项目已从一个极客玩具演变为在实际业务中落地的生产力工具,国内多家基模大厂也已发布类似产品或功能[3] - 项目正引发一线开发者、技术创始人及核心工程师对AI编程在实际应用、思考与困惑的深度讨论[3] Vibe Coding时代:代码成为负债与开源治理挑战 - OpenClaw项目主干平均每小时收到30到60个PR,高峰期超过100个,官方仓库随时有超过2000个待处理PR,贡献被合并的概率约为两千分之一[6] - 开源维护模式被颠覆,维护者心态转向“Code as Liability(代码是负债)”,每增加几百行代码都可能引入问题,使项目未来更难维护[8] - 传统的开源信任链条断裂,合并PR更多基于对工程师工程能力及其持续维护信用的信任,而非代码审查[9] - 未来可能出现以分钟为单位涌入海量高质量PR的情况,当前的Git基础设施、软件仓库演进生态及治理规范面临未知挑战[11] AI生成代码的测试价值与策略演变 - 在代码由AI生成(Vibe Coding)的时代,测试比真实代码更值钱[14] - 需要严格制定测试规则以防止AI生成无效测试(如“瞎Mock”),并确保内部库和服务调用不被Mock[14][16] - 测试的黄金准则是越接近实际使用方式,越能带来信心,因此尽管维护成本高,端到端(E2E)测试对于捕捉线上问题至关重要[16] - 大模型输出存在波动,类似“抽卡”,建议建立自己的Benchmark来从概率中寻找准确性,保证项目持续前进[18] 用户采纳的两极分化与“超级个体”的涌现 - 在普通用户和专业工程师之间存在巨大认知差,普通用户常因环境配置等问题导致使用OpenClaw成功率不高[20] - 但一旦成功运行,用户体验具有“Feel of AGI”的震撼感,尤其当与日常工具(如WhatsApp, Gmail)连接后[20] - 少数“Pro User”或“Power User”已能通过纯自然语言交互,熟练运用OpenClaw及各类开发工具,实现包括招聘自动化在内的复杂业务流程,成为“超级个体”[22] - 甚至有非技术背景的文科生通过依赖AI团队,成功为OpenClaw项目提交并被合并了9个PR,跻身全球贡献者前50名[24] 工程师角色的演变:从功能编码到平台工程 - 工程师的核心能力正从做功能编码(Feature Coding)转向更注重整个平台工程(Platform Engineering)[28] - 工作呈现“左移”和“右移”趋势:“左移”指在代码合并前注重提供容器化隔离环境、约束规范下的AI编码;“右移”指在代码合并后注重可观测性、问题回滚等韧性建设[26][28] - 随着AI自动生成代码能力增强,中间的功能编码环节重要性下降,而平台工程的质量控制角色变得更为关键[28] Agent形态演进与硬件可能性 - OpenClaw深度结合本地设备(如苹果生态),带火了“个人助理”概念,催生了“Agent Computer”这一新硬件形态的设想[30] - 例如“Pamir AI”项目设想了一种售价250美元、计算器大小、能24小时在线并通过物理接口介入物理世界的硬件[30] - 未来用户可能不再面对数百个软件界面,而是由100到500个Agent提供服务,硬件设备形态将发生重大改观[30] OpenClaw的产品哲学:长周期主动陪伴伙伴 - 与Claude Code等专注于原子性任务的“单元型Agent”不同,OpenClaw设计为“长周期、永远在线、有主动性”的陪伴型伙伴[31][32] - 其核心差异在于内置了Heartbeat机制,能周期性唤醒执行后台任务,并保持记忆和任务的长期连续性,更像一位身边的同事[32] 当前将OpenClaw产品化(SaaS化)的挑战 - 成本问题:若作为SaaS服务(如月费二三十元),为每个用户绑定一个Claude或Kimi套餐,成本难以核算[33] - 权限与安全问题:用户文件隔离难,且用户可能诱导高权限的OpenClaw修改自身代码,引发供应链安全风险[34] - 一致性问题:AI处理相同任务时,难以给出高度一致、可复现的结果,用Prompt控制效果不佳,导致难以作为可靠服务交付[34] 模型能力拐点与“Token税”时代的学习范式 - Claude 4.5 Opus的发布是一个分界线,标志着模型在编程领域从“玩具”状态进入“生产级可用”状态[35][36] - 模型能力的快速迭代依赖于快速试错和“揉数据”,即生成高质量轨迹供模型学习[37] - 由此产生了“Token税”概念:谁使用的Token越多、试错越多,谁就越能理解AI的“思维模式”,积累更多经验[38] - 当前时代的核心建议是“不断尝试”,找到AI能稳定完成任务的路径,并将此认知固化为自身能力[38]
技术框架不重要,大厂简历不值钱?小哥不会写代码却进了Lovable,80% 靠聊天也能上生产
AI前线· 2026-02-10 10:05
Lovable公司概况与Vibe Coding岗位 - 公司估值达66亿美元(约合人民币457亿元),拥有800万用户,员工仅517人,人均估值接近1亿元人民币 [2] - 公司在4个月内,年度经常性收入从1亿美元翻倍至2亿美元,增长迅速 [4] - 公司核心产品为AI建站平台,主打“用一句话生成完整网站/应用”,用户无需编写代码或拖拽组件,通过描述需求即可生成页面、交互和风格 [9] Vibe Coding工程师的角色与工作方法 - 首位正式Vibe Coding工程师Lazar Jovanovic无编程背景,其工作80%时间用于规划和对话,仅20%用于工具执行,核心挑战在于“把话说清楚” [6][7][11] - 工作方法强调并行构建与清晰表达:针对同一想法,并行开启四五个不同版本(如语音脑暴、整理提示、参考图、代码片段),让AI生成多种方案,再从结果中倒推需求 [12] - 采用系统化流程管理项目:通过并行构建选出最佳方案后,会生成产品需求文档、主计划、实施计划、设计指南、用户旅程等系列文档,并整合成任务清单(如tasks.md)和规则文件(如rules.md),为AI提供清晰上下文和行动指南 [47][48][49][50][51][52] - 工作内容广泛,横跨多个部门,包括构建营销销售模板、内部工具(如功能采用矩阵)以及公开的产品级应用(如Shopify集成模板和商品商店) [19][20] AI时代的能力转型与职业发展 - 在AI公司中,60-70%的传统工作方法已不再适用,核心能力从“敲代码”转变为“跟AI把产品聊出来” [10] - 无技术背景可能成为优势,因其不受“先验限制”束缚,能以“积极妄想”的心态尝试传统认知中“不太可能”的事情,例如在平台上生成Chrome扩展或视频 [25] - 未来职业将越来越以“能力组合”而非单一标签(如程序员、产品经理)来定义,价值创造者更像是“用AI把想法快速转化成现实的人” [68][69][70] - 在AI工具普及的背景下,“够用”与“世界级”产品之间的差距变得巨大,未来的关键竞争点在于优化判断力、审美、清晰度和设计品味,而非特定技术栈 [35][36][63][89] - 职业发展路径发生变化,“作品比履历重要得多”,通过公开构建真实项目展示能力是有效的入行方式 [74][75] 使用AI工具的核心原则与调试技巧 - 使用AI工具的核心是解决“清晰度”问题,而非编码本身,需要优化表达的具体性和上下文供给 [28][32] - 存在机器与人类两方面的限制:机器层面受限于上下文记忆窗口(Token限制);人类层面受限于表达不够具体,AI缺乏人类经验来理解模糊语境 [30][31][32] - 提出“4x4”调试框架应对构建过程中的问题:1) 使用工具自带的“尝试修复”功能;2) 通过添加控制台日志帮助AI“看见”问题;3) 引入外部诊断工具(如Codex)分析代码和日志;4) 回滚版本并重新构思提示词 [79][80][81][83] - 建议将每次调试中学到的经验写入规则文档,或直接让AI帮助起草更好的提示词,以实现自我改进 [84][85] 对工程职能未来的看法 - 软件工程师职能不会消失,未来比以往更需要“精英工程”来维护、扩展和加固系统,以支撑一个“数十亿构建者”的世界 [77][78] - 在人人可构建的时代,维护代码库、保障基础设施稳定(如应对流量冲击)等工作仍需高技能工程师完成 [77][78]
从DeepSeek恐慌到Cowork恐慌
虎嗅APP· 2026-02-09 17:43
文章核心观点 - AI智能体(如Anthropic的Claude Cowork)和高效低成本模型(如DeepSeek R1)的出现,对传统SaaS软件公司的商业模式构成了根本性挑战,可能引发行业价值重估和长期结构性调整 [5][7][10] 市场恐慌事件比较:DeepSeek恐慌与Cowork恐慌 - **DeepSeek恐慌(2025年1月)**:DeepSeek发布训练成本仅为560万美元的R1推理模型,引发市场对美国科技巨头巨额AI投资价值的担忧,导致英伟达股价单日暴跌17%,市值蒸发近5890亿美元,纳斯达克指数下跌3.1% [6][7] - **Cowork恐慌(2025年2月)**:Anthropic推出通用AI智能体Claude Cowork及其开源插件,引发市场对传统企业软件专业知识价值被替代的担忧,导致汤森路透单日暴跌15.8%,标普500软件与服务指数五个交易日下跌近13% [5] - **两次恐慌的异同**:两者传导路径相似,均有市场反应过度之嫌;但本质不同,DeepSeek是“从1到n”的成本挑战,Cowork是“从0到1”的用例创新,后者的影响可能更为持久 [9][10] - **市场表现差异**:DeepSeek恐慌在一天内基本消化,英伟达次日反弹9%;Cowork恐慌引发的软件股抛售蔓延了整整一周,并扩散至全球市场,且无缓解迹象 [11] 传统SaaS商业模式面临的挑战 - **定价模型脆弱**:传统按人头(席位制)的收费模式在AI提升效率、可能导致企业缩编时面临收入下降风险 [14] - **计费模式转型**:SaaS公司正纷纷从买断制转向按用量计费,PricingSaaS 500指数显示,前500家公司平均每年发生3.6次定价变动,79家公司提供基于点数的定价,同比增长126% [15] - **混合模式效果最佳**:采用基础月费加超额买点卡的混合模式报告最高中位增长率为21%,表现优于纯订阅和纯用量计费产品,46%的SaaS公司结合了订阅与可变收费 [17] - **AI功能涨价受阻**:企业对传统软件捆绑AI并涨价的行为抵制强烈,例如部分团队拒绝为员工支付每月30美元的365 Copilot费用,微软因“强制捆绑AI”及隐藏低价方案遭到起诉并引发客户不满 [17] - **AI转型低效**:传统软件巨头试图在现有产品中嵌入AI,但往往功能堆砌、无人使用,其AI转型的笨拙与AI原生初创公司形成鲜明对比 [17] AI原生初创公司的崛起与传统SaaS的衰落 - **融资与估值**:AI原生初创公司获得大量融资,例如法律AI公司Harvey在2025年两次融资各3亿美元,估值达50亿美元;企业搜索AI公司Glean估值达72.5亿美元 [18] - **市场表现差距**:2025年,AI应用层占据超过一半的企业AI支出(190亿美元),其中AI原生初创公司的收入几乎是传统软件厂商的两倍,其中位年增长率达到100%,而传统SaaS公司仅为23%,差距达4.3倍 [18] - **传统SaaS的“三步灭亡”模式**:以Chegg为例,第一步是否认AI有效;第二步是宣布接入AI但效果不佳;第三步是走向灭亡,其订阅用户从2022年高峰的530万骤降至2025年的320万,股价从高点跌去99%,市值从147亿美元萎缩至约1.56亿美元 [22][23] 未来趋势:Vibe Coding与企业自建工具 - **降低开发门槛**:Vibe Coding(用自然语言生成应用)若走向成熟,将促使个人和企业倾向于自己制作工具而非购买第三方SaaS产品 [20] - **企业适应速度**:当新事物部署成本足够低时,企业适应速度很快,例如社交网络普及后企业官网更新减少,Threads上线后企业迅速将其加入运营列表,以及2025年初企业纷纷接入DeepSeek [21] - **对低代码平台的冲击**:基于规则的低代码/无代码平台已成为AI模型能力进化的牺牲品 [21] - **传统软件业的剩余价值**:未来传统软件业的最大价值可能在于处理客户非标需求、通用AI产品不愿做或客户自己无法通过Vibe Coding实现的“脏活累活” [24]
全网最详细的Codex入门教程,手把手教你玩转Vibe Coding。
数字生命卡兹克· 2026-02-09 09:30
文章核心观点 - OpenAI推出的编程代理应用Codex,特别是其搭载的GPT-5.3-codex模型,在速度、能力和用户体验上相比前代产品及主要竞争对手(如Anthropic的Claude Code)有显著提升,为非专业编程用户提供了高效、易用的“Vibe Coding”入门及进阶解决方案 [3][4][6][8][12] 产品定义与定位 - Codex是OpenAI对标Anthropic的Claude Code推出的编程代理应用,其本质是一个上层封装了工程化能力的编程Agent,由于现代信息化社会构建于代码之上,强大的编程能力使其趋近于通用Agent [14][15] - GPT-5.3-codex是一个纯粹的编程特化模型,在创作、事实核查等非编程领域效果不佳,因此未集成到面向大众的ChatGPT中,目前仅在Codex应用中可用 [16][17][18] - Codex应用提供了可视化的图形界面,极大地改善了非专业编程用户的体验,避免了使用命令行界面(CLI)或文本用户界面(TUI)时常见的反直觉操作困扰 [8] 产品性能与体验 - GPT-5.3-codex模型在编程任务上的能力被认为强于Claude Opus 4.6,并且在速度上相比前代GPT-5.2-codex有“N倍”提升,解决了之前版本因速度过慢影响使用体验的问题 [4] - 作者通过一个周末的使用,利用Codex解决了四五个过去个人无法独立完成的开发需求,并体验到进入心流状态的爽感 [6] - 在定价方面,文章对比了Claude Opus 4.6的快速模式,指出其价格昂贵,例如处理1百万令牌(1M Token)的消耗高达150美元,而OpenAI的Codex(需Plus或Pro会员)在此方面更具吸引力 [9][10] 产品功能与使用逻辑 - Codex采用“文件夹(工作区)”与“线程(Thread)”的两层结构来组织项目,文件夹用于存放代码和资料,线程用于管理围绕特定目标的独立对话和任务进程,这种设计有效避免了不同任务间的上下文污染 [26][27][28][29][31][34][36][37] - 应用内置了“定时任务”功能,允许用户设定Codex在特定时间自动执行任务,例如服务器巡检、错误处理与报告 [51][52][53] - 应用提供了可视化的“技能(Skills)”管理界面和内置的“技能创建器(Skill Creator)”,用户可以通过自然语言描述轻松创建和管理技能,简化了技能生态的构建和使用流程 [54][55][56][57] - “计划模式(Plan mode)”功能允许用户在开发大型项目前,先由AI生成详细的规划文档和实现计划,经用户确认后再进入实际开发阶段,有助于提高项目成功率 [63] - 用户可以为Codex设置全局规则(替代传统的AGENT.md文件),以指导AI在代码质量、安全规范、输出格式等方面的行为 [58][60][62] - GPT-5.3-codex提供四个推理深度等级(如High, Extra High),等级越高,模型思考越深入,结果更稳定全面,但速度更慢、成本更高,用户可根据任务难度进行选择 [64] 市场影响与行业趋势 - 编程代理(如Codex, Claude Code)的出现正在改变软件开发的逻辑,其强大的能力甚至能对华尔街等传统行业产生冲击,例如Claude的Excel协同插件曾引发市场关注 [15] - 对于非程序员而言,AI编程工具的价值可能超过对程序员的价值,因为它移除了学习编程的障碍,使得利用代码实现创意成为可能 [76][77] - 未来,使用AI编写代码可能像使用Excel一样,成为一项普遍的基本技能 [78][79]
从DeepSeek恐慌到Cowork恐慌
36氪· 2026-02-09 07:50
文章核心观点 - 全球软件股因Anthropic推出通用AI智能体Claude Cowork而遭遇抛售 市场担忧AI智能体可能颠覆传统SaaS软件的商业模式 导致专业知识与垂类经验积累的价值受损 此次“Cowork恐慌”与一年前因DeepSeek引发的“DeepSeek恐慌”相似但可能更为持久 [1][2][4] - 传统SaaS软件行业面临来自AI原生应用、定价模式转变及企业自建工具趋势的多重结构性挑战 其商业模式和价值可能被逐步侵蚀 [6][7][11] 市场恐慌事件比较 - **DeepSeek恐慌 (2025年1月)**: DeepSeek发布低成本推理模型R1 训练成本仅为560万美元 引发市场对科技巨头巨额AI投资价值的质疑 导致英伟达股价单日暴跌17% 市值蒸发近5890亿美元 但恐慌在一天内基本消化 英伟达次日反弹9% [2][5] - **Cowork恐慌 (2025年2月)**: Anthropic推出可操作电脑文件的通用AI智能体Claude Cowork及其开源插件 引发对SaaS软件公司未来的担忧 导致标普500软件与服务指数连续五个交易日下跌近13% 较10月高点跌去26% 汤森路透等多家软件公司股价单日暴跌10%-20% 此次恐慌已蔓延一周且尚未缓解 被认为可能比DeepSeek恐慌更持久 [1][4][5] 对传统SaaS商业模式的冲击 - **定价模型脆弱性**: 传统软件按人头计费(席位制)的模式在AI提升效率可能导致企业缩编时面临收入减少的风险 SaaS公司正纷纷转向按用量计费 2025年排名前500的SaaS公司平均每年发生3.6次定价变动 其中79家提供基于点数的定价 同比增长126% [7][8] - **混合计费模式效果最佳**: 采用基础月费加超额买点卡混合模式的产品报告中位增长率最高 达21% 表现优于纯订阅和纯用量计费产品 46%的SaaS公司结合订阅与可变收费 [9] - **AI功能涨价遭抵制**: 传统软件加入AI后涨价逻辑遭到客户强烈抵制 例如部分企业拒绝为员工支付每月30美元的Microsoft 365 Copilot费用 微软因“强制捆绑AI”及隐藏低价方案遭到起诉 并宣布从2025年7月起对商业套件每人每月强制涨价3美元 [9] 行业竞争格局变化 - **传统软件公司AI转型低效**: 许多传统软件巨头在现有产品中嵌入AI的尝试往往笨拙低效 功能堆叠但无人使用 [9] - **AI原生初创公司快速崛起**: 在传统软件涉及的领域 从头开始的原生AI智能体初创公司获得大量融资 例如法律AI公司Harvey在2025年两次融资各3亿美元 估值达50亿美元 企业搜索AI公司Glean估值达72.5亿美元 [10] - **市场份额与增长差距**: 2025年AI应用层占据超过一半的企业AI支出(190亿美元) 其中AI原生初创公司的收入几乎是传统软件厂商的两倍 AI原生初创公司的中位年增长率达100% 而传统SaaS公司仅为23% 差距达4.3倍 [10] 潜在威胁与发展趋势 - **企业自建工具趋势(Vibe Coding)**: 如果“Vibe Coding”(用自然语言生成应用)走向成熟 企业可能倾向于自己制作工具而非购买第三方SaaS产品 只要新事物部署成本足够低 企业的适应速度并不慢 [11] - **传统软件公司的“三步走向灭亡”模式**: 以在线教育公司Chegg为例 第一步是否认AI有效 第二步是宣布接入AI但效果不佳 第三步是走向灭亡 Chegg订阅用户从2022年高峰的530万骤降至2025年的320万 股价从2021年高点113美元跌去99% 市值从147亿美元萎缩至约1.56亿美元 [12] - **传统软件业的未来价值**: 传统软件业的最大价值可能转向处理客户非标的、AI通用产品不愿干的“脏活累活” 但这并非性感的商业模式 而AI模型需持续提升编程能力 减少幻觉 直到达到用户不在意的临界点 [13]
苹果破防,App Store暴涨60%,全是“俺寻思”写出来的?
36氪· 2026-02-06 17:16
行业趋势:App Store应用提交量激增与AI驱动开发范式变革 - App Store新应用提交量在2024年下半年出现惊人拐点,从长期持平的约5万个激增至7.8万个,涨幅高达60% [1][2] - 2025年App Store新增应用提交量达到55.7万次,比2024年增加24%,这是自2016年以来的首次实质性增长 [13] - 增长主要由AI驱动的“Vibe Coding”开发模式推动,该模式使开发周期从传统团队的2-3个月压缩至24小时,催生了大量“一人公司” [6][8][10] 市场结构:非游戏应用收入超越游戏及“一人公司”崛起 - 2025年移动市场非游戏应用收入首次超越游戏应用,达到856亿美元 [8] - 增长背后是无数“一人公司”利用AI工具快速催生大量极简工具、AI助手和垂类生活应用 [10] - 一个典型案例是,一名独立开发者利用AI工具在24小时内构建的SaaS数据追踪工具,其单日产出超过了此前整个团队的开发效率 [30] 技术工具:AI编程工具链构成“军火库” - 当前AI工具链是“Vibe Coding”这场非对称战争中的“核武器库” [22] - Claude 3.5 Sonnet被开发者称为“Sonnet Coder”,在处理UI布局、交互细节和理解模糊指令方面表现出惊人灵性,降低了沟通成本 [23][24][25] - 深度集成AI的编程IDE成为主流:Cursor是行业领军者,集成了对大规模代码库理解力极强的模型;Windsurf是极具威胁的挑战者,凭借Agent系统和每月15美金的定价吸引价格敏感开发者 [26][27] - 国产DeepSeek R1以极低价格击穿成本底线,配合Roo Code插件,可将试错成本从几百美金骤降至几美金,成为个人开发者的首选推理引擎 [28][29][30] 开发模式:“Vibe Coding”的本质与影响 - “Vibe Coding”模式下,开发者无需理解传统编程语法,只需用自然语言向AI灌输感觉,核心角色从逻辑构建者转变为结果校验者 [5][19] - 该模式信奉快速迭代,其“反馈循环”速度是手工敲代码的50到100倍,直接催生了App Store的提交量增长 [21] - 开发者重点从算法优雅性转向测试特定交互或UI风格能否快速击中用户多巴胺,逻辑正确性让位于用户的视觉爽感 [18][37] - 然而,该模式被部分资深工程师视为“数字炼金术”,会生成缺乏架构设计的“面条代码”,使应用背负巨大技术债和安全漏洞,因为大量新开发者为了追求速度跳过了代码审查 [32][33][35] 平台监管:苹果App Store的政策收紧 - 为应对AI批量生成“换皮应用”带来的“工业废料”,苹果在2025年末更新《App Store审核指南》 [38][41] - 新规4.1(c)严打通过AI批量生成的山寨行为;新规5.1.2(i)强制要求所有涉及第三方AI的数据传输必须获得用户显式授权 [39] - 凡未明确披露数据流向或仅为API套壳的应用将被清退,那些在高性能设备上运行出现掉帧或UI错位的“Vibe App”正在被大批量处理 [41] 未来展望:创意与审美的价值凸显 - 当“言出法随”的编程能力成为标配,平庸的创意将变得一文不值 [43] - 在代码贬值、算法透明的时代,核心竞争力转向对人类痛点的敏锐洞察和AI难以模仿的极致审美 [43] - 在苹果的数字生态内,单纯的代码堆砌已无价值,只有在算法之上注入极致审美与人性洞察的产品才能持续生存 [44]
苹果 Xcode 终于引入 AI,“Agentic Coding”攻入“果系”开发者大本营
36氪· 2026-02-04 16:27
核心观点 - 苹果公司于2026年2月3日正式发布Xcode 26.3版本,核心更新是引入“智能体编程”功能,深度集成Anthropic的Claude Agent和OpenAI的Codex等第三方AI智能体,标志着其开发工具正式拥抱AI浪潮[1] - 此举被视为苹果在AI编程工具竞争加剧背景下的战略卡位,旨在避免开发者生态流失,并顺应生产力软件AI功能从“插件化”走向“原生一体化”的行业趋势[10][11] 功能特性 - **智能体能力**:集成的AI智能体通过模型上下文协议与Xcode深度集成,具备高自主性,可执行浏览搜索项目结构、读写编辑移动删除文件、根据指令构建项目、自动抓取苹果官方开发者文档等复杂任务[1] - **进阶功能**:提供预测性代码补全,能根据上下文推断整段逻辑;支持通过自然语言指令让AI代理自动创建文件、编写单元测试、运行Build,并能自动查找编译错误并尝试修复,形成闭环能力[4][5] - **辅助功能**:整合对DocC规范的支持,可自动为选中代码生成符合规范的文档注释[7] 市场反应与用户反馈 - **积极评价**:有开发者认为,Codex在Xcode中管理自身安装并与IDE深度结合,提供了“非常舒适的默认体验”[9] - **负面评价**:部分尝鲜用户反映功能存在卡死、需强制退出的问题;其代码差异对比机制不佳,AI修改小功能时常重新生成整个文件,导致Token消耗大,并可能误删原有正确代码致使代码库崩溃[9] - **竞争对比**:在部分资深开发者看来,Xcode AI在处理跨文件复杂重构时表现不如Cursor等竞争对手稳健[9] 行业背景与战略意图 - **竞争压力**:过去一年,以AI为核心重构的编辑器(如Cursor、Windsurf)迅速崛起,微软也通过GitHub Copilot深度渗透开发环节,对传统IDE市场构成侵蚀,苹果面临开发者“用脚投票”的风险[10] - **战略选择**:苹果选择直接与OpenAI、Anthropic合作而非完全自研,采取务实的“拿来主义”,旨在以最快速度补齐AI能力短板[11] - **行业趋势**:重要的生产力软件其AI能力正从“插件化”走向“原生一体化”,平台方正收回主导权,独立AI工具的机会窗口正在关闭[11] 对开发者的影响 - **挑战**:基础编码技能价值被稀释,开发者必须持续学习与AI协同的工作流[11] - **机遇**:AI大幅降低将创意转化为原型和产品的门槛,极大扩展了独立开发者或小团队的能力边界,可能催生“一人军团”式的创新浪潮[11] - **角色演变**:未来优秀的开发者可能更侧重于成为善于为AI智能体设定目标、划分职责并进行质量把关的“AI团队管理者”[11]
我拥有了超能力,Meta最牛文科生让3个AI互掐,竟造出1人技术部
36氪· 2026-02-03 12:11
AI赋能非技术人员实现生产力跃迁 - Meta产品经理Zevi Arnovitz作为非技术背景人员(音乐与心理学背景),通过使用Claude和Cursor等AI工具,成功开发了名为StudyMate的学生辅助应用,并仅用2天时间完成了将应用从英语本地化为希伯来语的庞大工程,而传统开发流程通常需要一个团队数周时间[6][12][13] - 该案例表明,AI工具正在推倒技术壁垒,将构建能力赋予有想法的普通人,使其能够探索以往不敢设想的领域,获得“超能力”[3][8][42] AI辅助编程的核心工作流与方法 - 采用“探索阶段”指令,强制AI在编写代码前先理解现有代码库架构、分析新需求影响并提出澄清性问题,确保人与AI达成共识后再开工,避免盲目编码导致的错误[20][21] - 将开发流程标准化为斜杠指令,例如通过“/create-issue”口述想法自动创建格式完美的工单,或通过“/create-plan”生成详细的Markdown实施计划,极大提升了项目管理效率[22][23] - 建立“AI同行评审”机制,利用不同AI模型(如Claude与Codex)的性格差异进行对抗性代码审查,让它们互相“找茬”以发现安全漏洞、逻辑死角等错误,优化代码质量[24][26] - 强调“文档即记忆”,通过“/update-docs”等指令持续更新架构与业务逻辑文档,以修正AI的有限上下文记忆,确保其在后续任务中不犯相同错误[28][29][30] AI模型的特点与协同使用策略 - Claude被视作沟通能力强、聪明且有主见的“完美CTO”,擅长架构且愿意协作[33] - Codex被想象为逻辑严密、死抠细节的“最强码农”,常用于解决最棘手的技术难题[33] - Gemini则被描述为有才华但行为难以预测的“疯狂科学家”,擅长设计但需谨慎管理[19][33] - 有效使用策略在于协同使用多个模型,发挥各自优势,并用其他模型来压制其短板[33] AI对职业角色与能力要求的重塑 - AI正在推动设计、工程、产品等传统角色边界的互相渗透与消失[39] - 行业趋势显示,未来职场更需要能利用工具将想法变为现实的“构建者”,例如LinkedIn已用“产品构建者”培养路线取代了传统的助理产品经理项目[40][41] - 对于产品经理等职位,能力门槛不降反升,仅会写文档和跑流程已不够,需要具备利用AI等工具进行直接构建的能力[36][37][38] - AI工具使得初学者可以跳过枯燥的基础训练,直接进入核心创造环节,极大地降低了初始学习曲线[47][48][49]