Vibe Coding
搜索文档
真香,刚骂完AI,Linux之父的首个Vibe Coding项目上线
36氪· 2026-01-12 16:32
项目发布与概况 - Linux 作者 Linus Torvalds 在 GitHub 上发布了一个名为 AudioNoise 的新项目,该项目与他的另一个项目 Linux 并列 [1] - 该项目是一个与吉他效果器相关的代码库,利用 AI 技术模拟箱体,其 Python 可视化工具基本采用 Vibe Coding 方式编写 [2] - 该项目在 5 天前上传至 GitHub,目前已获得 1.4k 个 Stars,拥有 49 个 Forks,13 个 Watching [5][6] 项目背景与目标 - AudioNoise 项目源自 Torvalds 几个月前进行的“随机吉他效果器板设计”(GuitarPedal)项目,该项目包含电路原理图和代码,已收获 1.5k 个 Stars 和 47 个 Forks [7][8] - 该项目是其在 Linux 内核之外的兴趣尝试,主要设计目标是学习数字音频处理的基础知识,而非打造成品设备 [7][9] - 项目专注于基础的数字音频处理,使用 IIR 滤波器和基础的延迟循环,采用“单采样输入,单采样输出,并且零延迟”的设计思路 [9] 技术实现与AI工具应用 - 项目中的 IIR 滤波器用于模拟移相器等模拟电路,通过数字全通滤波器模拟 RC 网络效果,并未使用高深的 AI 箱体模拟技术 [10] - Torvalds 在开发中使用了名为 Google Antigravity 的 AI 编程工具来编写音频样本可视化工具,省略了传统的“搜索并照搬”编程环节 [4][10] - Torvalds 对使用 AI 编程工具的心得是过程基本顺利,并认为氛围编程(Vibe-Coding)的效果比自己动手写要好 [10][11] - Google Antigravity 是谷歌于去年11月发布的智能体式开发平台,对标 Cursor,背靠 Gemini 3 大模型,可驱动智能体自主规划和执行复杂的软件任务 [13] 行业反响与意义 - Torvalds 使用 AI 编程工具在科技圈内引发了现象级讨论,被视为 AI 大势下的标志性事件 [15] - 行业意见领袖指出,包括构建编译器、CUDA 内核和操作系统在内的顶尖程序员,其认为“所有 AI 代码都是垃圾”的想法正在迅速改变,并对 AI 的强大感到震惊 [15] - Antigravity 的创建者、谷歌 DeepMind 工程师 Varun Mohan 将 Torvalds 视为编程偶像,对其使用该工具感到荣幸 [17] - Vercel CEO 将 Torvalds 使用氛围编程与陶哲轩宣布 GPT 解决 Erdős 问题、DHH 收回“AI 不会编程”言论等事件并列为 2026 年开年大事 [18] 开发者态度转变 - 就在几天前,Torvalds 在讨论规范 AI 生成 Linux 内核代码时,曾严厉批评 AI 生成“垃圾代码”的行为,并反对在内核开发文档中包含任何关于 AI 的声明 [22][23] - 他此前曾明确表示,对于生产环境和内核开发,Vibe Coding 是一个“非常,非常糟糕的主意”,并认为当前的 AI 辅助编程是“90% 的营销加 10% 的现实” [20][22] - 此次其亲自发布使用 AI 工具编写的 AudioNoise 项目,被视为其态度的一次显著转变 [23]
真香!刚骂完AI,Linux之父的首个Vibe Coding项目上线
机器之心· 2026-01-12 14:35
文章核心观点 - Linux创始人Linus Torvalds在其个人兴趣项目AudioNoise中,公开使用了“氛围编程”方式,即借助谷歌的AI编程工具Antigravity进行开发,这标志着这位曾对AI编程持批评态度的顶尖开发者开始拥抱并实践AI辅助编程[1][3][9][16][18] Linus Torvalds的新项目AudioNoise - 项目名为AudioNoise,是一个与吉他效果器相关的数字音频处理代码库,旨在探索数字音频处理基础知识,而非打造成品设备[4][6][12][14] - 该项目于5天前上传至GitHub,已获得1.4k个Stars和49个Forks[10][11] - 项目源自其更早的“GuitarPedal”兴趣项目,该项目旨在学习模拟电路设计,已获得1.5k个Stars和47个Forks[12][13] - 项目技术核心是基础的IIR滤波器和延迟循环,进行单采样输入输出的处理,并未使用复杂的FFT或实时处理技术[15][16] - 项目中的Python可视化工具基本是使用“氛围编程”方式编写的,即借助AI工具生成代码[6][16] 对AI编程工具的使用与评价 - Torvalds在开发中使用了谷歌的AI编程平台Antigravity,该平台于去年11月发布,基于Gemini大模型,旨在驱动智能体完成端到端的软件任务[20] - 他起初采用典型的“搜索并照猫画虎”式编程,后来省去自己作为中间环节,直接让Antigravity生成音频采样可视化工具[8][16] - Torvalds对使用AI工具的过程评价积极,认为“过程基本顺利”,并肯定最终效果比自己动手写要好[17][18] - 此次实践与其此前对AI编程的公开批评态度形成鲜明对比[27][28] 行业反响与意义 - Torvalds使用AI编程工具在开发者社区引发了现象级讨论,被视为一个标志性事件[22] - 行业领袖如谷歌DeepMind工程师Varun Mohan(Antigravity创建者)和Vercel CEO Guillermo Rauch均对此事表示关注,后者将其与陶哲轩使用AI解决数学问题等事件并列,视为2026年初的重要行业动态[23][24] - 社区观察指出,一些曾强烈批评AI代码质量的顶尖程序员,其想法正在迅速改变,并对AI的能力感到震惊[22] Linus Torvalds此前对AI编程的态度 - 直到去年底,Torvalds对AI编程仍持相对保守态度,认为“氛围编程”对于生产环境和内核开发是“一个非常,非常糟糕的主意”[28][30] - 他认为当时的AI辅助编程是“90%的营销加10%的现实”,并极其反感向内核提交AI生成的“垃圾代码”的行为[30] - 在2025年1月7日的一次内核开发讨论中,他强烈反对在文档中规范AI生成内容,称讨论AI生成的垃圾“毫无意义,简直愚蠢至极”[31][32]
全网380万人围观!连代码都不看,4个月“烧掉”30亿Token,不懂编程的他却做出了50+个产品……
猿大侠· 2026-01-07 12:11
AI Agent驱动的软件开发范式变革 - AI Agent使非专业开发者在短时间内交付大量真实项目成为可能 例如一位几乎不会写代码的从业者在四个月内通过AI Agent协作消耗约30亿个token 完成了数十个真实项目的开发与上线[1] - 这种开发模式的核心在于人机协作 从业者通过仔细审视AI Agent的输出 理解代码逻辑和项目流程 从而掌握编程知识 这被视作新一代的编程学习路径[3] 高效能AI协作的具体工作方法 - 工作流程高度依赖命令行界面(CLI) 因其能力上限更高且过程透明 能直观看到AI的工作过程[5] - 具体工作流程分为五步:需求梳理与项目创建、上下文投喂与计划制定、细节追问与方案确认、放手让AI执行并监控日志、测试与迭代优化[7] - 强调通过动手实践和解决问题来学习 将经验模板化并记录在`agents.md`操作手册中供所有项目复用 并强制进行端到端测试以避免低级错误[8] - 通过集成GitHub应用和Telegram机器人等工具 实现代码自动审核、远程移动端编程以及与AI Agent的高效团队协作[9] AI协作催生的实际项目成果与技能获取 - 四个月内完成的项目覆盖个人、工作与技术探索等多个场景 包括个人网站重构、Feed聚合器(开源获100多颗星)、年度总结原型(被团队采纳为产品功能)、多个自制CLI工具、加密货币自动交易器、12天创意实验项目以及AI驱动的视频演示系统等[4][6] - 通过与AI Agent协作 从业者掌握了Bash命令行、VPS使用等硬核技能 并学会了技能模块化复用 例如开发可被所有项目调用的Gmail CLI工具[10][11][12][13] - 从业者认为新时代的核心技能是与AI Agent协作的抽象层能力 包括提示词编写、上下文提供以及引导AI理解系统原理 而非传统编程语言本身[13] 新兴开发模式的特点与行业影响 - 该模式降低了编程门槛 使非技术背景者能够通过“跳出能力范围做项目”的方式快速学习 建议从简单CLI工具和项目开始 在试错中前进[21] - 该模式不同于传统的分步教程式学习 强调通过系统思维理解项目构建 并能通过探索开源项目(git clone)快速学习 极大缩短了学习曲线[17][18][19] - 从业者将自己定义为“新技术阶层” 通过与AI协作掌握代码能力并探索新的工作模式 而非传统的“氛围编码者”或程序员[19] - 该模式支持轻量化试错 一个原型可能在几小时或一个周末内完成 使得“半途而废”的成本极低 从而鼓励大量创新尝试[20] - 预测未来将出现一波软件爆发 尽管部分作品粗糙 但会有大量优质项目涌现 供人们使用、克隆和修改 整体开发效率将远超传统模式[20]
让 AI 干活反而累成狗?Vibe Coding 正在掏空我的大脑
36氪· 2026-01-05 11:06
编程范式演变 - 1970年代编程被视为严谨的逻辑推演过程 是开发者抽象思维的具体外化[1] - 2025年古典编程的优雅被Vibe Coding范式打破 该词已成为年度词汇[3] - Vibe Coding模式下 开发者无需逐行编写代码 而是像导演一样对AI编程工具如Claude或Cursor进行指令描述[3] Vibe Coding的工作模式与影响 - Vibe Coding追求“氛围”正确 能快速生成成百上千行代码 看似是生产力奇迹[5] - 其实际将体力劳动转变为超负荷的认知空转 并未让开发者更轻松[5] - 工作循环变为:输入提示词、生成代码、发现报错、点击修复、再次生成 彻底取消了传统编程中的“加载条”等待时间[6][8] - 类比从手工耕地变为驾驶时速200公里的联合收割机 开发者需适应机器的节奏[8] AI编程引发的职业疲劳 - 资深开发者感到一种“大脑被掏空”的虚脱感 不同于传统加班写代码的疲劳[6] - 传统编程中 代码编译或思考的“慢节奏”让大脑有时间构建完整的心理模型[6] - Vibe Coding编码速度过快 大脑无法实时处理 导致思路混乱 复杂任务被压缩至几秒或几分钟内完成[10] - 开发者从“生产者”转变为“审查者” 需要进行高频的上下文切换 例如AI可能一次迭代修改多个不同模块的文件[10] - 大脑处理这种快速切换消耗巨大 例如在Cursor中切换可能只需一秒 但大脑处理所需消耗的葡萄糖是惊人的[12] - 开发者需在“自身意图”与“AI实现”之间进行持续的双向对齐 通过观察运行结果猜测AI意图[12] - 开发者角色类似空中交通管制员 需同时监控多个“跑道” 时刻警惕生成代码中可能存在的致命Bug 精神持续紧张[12] - 这种持续进行“小决策”的压力导致一种“隐性疲劳” 大脑在不停循环中逐渐过热[14] 工具与人类节奏的冲突 - 工具正在夺取开发者的节奏感 人类成为AI行动中的一环[14] - AI不会疲倦 可在获得模糊反馈后持续输出新代码 为了不闲置这台算力机器 人类被迫加快反馈速度[15] - 核心问题在于当人类思考速度跟不上AI生产速度时应如何应对[15] 应对策略与建议 - 应有意识地控制节奏 不被AI的生成速度带跑 即使AI已准备好下一段代码 也应以自身节奏处理[18] - 建议每日进行手动回顾 整理AI生成内容以重建脑中心理模型 实现与AI的“认知对齐”[18] - 倡导方案先行 在前期做好引导 定好方向与路径后再细致展开 避免频繁返工 适当放手让AI执行[18] - 在AI夺走节奏前 开发者需要学会主动按下“暂停”键 重新夺回用于“思考”的间隙[17]
Claude Code、Cursor 都过时了?!硅谷顶流大牛炸场暴论:AI 编程练满 2000 小时才算“会用”,荒废一年世界级大神也成实习生水平
AI前线· 2026-01-02 13:32
文章核心观点 - 资深技术专家Steve Yegge认为,软件开发正进入“代码工厂化”时代,工程师必须从传统IDE编程转向AI Agent编程,否则将迅速失去竞争力 [5][7][9] - AI驱动的“Vibe Coding”或“Agent编程”能带来10倍级的效率提升,但掌握它需要约2000小时(约1年)的磨合,核心技能从写代码转变为指挥和管理AI Agent编队 [5][9][13] - 行业正处于剧烈转型期,传统开发规则(如“永远不要重写代码”)已失效,高生产力带来的代码合并(merge)冲突成为新瓶颈,同时领先的AI公司内部在快速扩张中普遍存在混乱 [5][33][42][47] Steve Yegge的职业生涯与理念 - Steve Yegge拥有30余年软件开发经验,曾在亚马逊早期(员工仅250人时)担任高级经理,参与技术体系与API战略搭建,后在谷歌主导构建了代码智能平台Grok [2] - 2022年加入Sourcegraph推动AI转型,并主导用“Vibe Coding”构建了拥有数万用户的问题追踪系统Beads,验证了“AI主导开发”的可行性 [3][30] - 他是“Vibe Coding”理念的激进倡导者,认为这是一场需要摒弃旧工作方式的运动,并出版了相关书籍 [7][13] 对传统开发模式与工程师的批判 - 批评仍使用传统IDE写代码的工程师“不是合格工程师”,认为IDE的核心价值应是作为AI的辅助工具,提供智能索引和增量构建 [5][14] - 指出资深工程师(拥有约12~15年经验者)因身份认同绑定在旧模式上,对AI和Vibe Coding最为排斥,但若不拥抱变化,世界级工程师一年后可能“沦为实习生水平” [8][10] - 认为一年未接触AI编程的工程师已属“恐龙级别”,技术迭代极快,两个月未尝试就可能落后 [10] AI编程(Agent编程)的实践、挑战与风险 - 掌握AI编程需约2000小时磨合,核心是能“预测AI行为”,而非情感信任,拟人化AI非常危险,可能导致生产数据库被删等灾难 [5][12] - Claude Code等现有工具(2024年技术栈)被认为已过时,操作复杂、需大量阅读,即便熟练使用者也会被其“离谱操作”困扰,全球80%-90%的程序员未真正采用 [5][16][17] - 未来的方向是“Agent编排控制台”,开发者从写代码转变为管理AI agent编队,让它们并行工作,甚至在自己睡觉时交付功能 [5][19][23] - 真正的难点在于让多个Agent协同工作,而非控制单个Agent,代码合并(merge)成为10倍高效团队的新瓶颈,有公司采取“一仓库一工程师”的临时方案 [5][32][33] 行业趋势与“代码工厂化” - 预测AI编程将进入“工厂化”阶段,类比从“镰刀收割”进入“机械化耕作”,这将彻底改变公司运作模式,理想团队规模可能缩小至两三人 [38][39] - “永远不要重写代码”的旧规已失效,对于许多代码库,“推倒重写”已经比重构更快,大模型尤其擅长此事 [5][43] - 所有代码和工具都在快速迭代,最终会变成“一次性的消耗品”,形成一场持续的军备竞赛 [42] 对主要AI公司内部状况的评价 - 指出OpenAI、Anthropic、Google在极速扩张下,内部实际上“非常混乱” [5][47] - Anthropic将混乱掩盖得最好,但正在为Claude Code等项目疯狂招聘;OpenAI经历核心成员离职,也很混乱;Google内部则因结构割裂,跨部门推进事情极难 [47] - 认为这三家公司都面临执行挑战,战况胶着,Anthropic目前可能稍好一点 [47] 技术发展与未来竞争格局 - 预测2025年可能成为“开源模型之年”,一旦开源模型达到Claude Sonnet 3.7水平,将提供接近2024年3月Claude Code的免费本地体验 [48] - 据接近研究核心的人士称,AI的“聪明程度”过去每18个月翻四倍,训练数据可能还能支撑两个周期(约3年),意味着模型可能变得比现在“聪明16倍” [50] - 未来的竞争关键在于工具能否做好任务拆解与模型分配,优化使用大小模型的成本 [48] 新时代工程师所需的技能与知识 - 真正的核心技能已转变为“学会指挥Agent”和“问对问题”,而非逐行写代码 [5][11] - 工程师仍需学习大量知识,以“语言无关”的方式理解编程概念(如函数、类、对象),思维层级需接近产品经理或架构师 [51] - AI工程师被定义为将模型潜力“用到极致”的人,他们不断发现提升效率的新方法和小技巧 [52]
从大厂设计师到超级一人公司:6000字回顾我和AI的2025
歸藏的AI工具箱· 2025-12-30 18:34
作者个人转型与业务模式 - 作者身份从大厂设计师转变为自由职业者,专注于将“歸藏”打造成一个可持续输出、有收入并能帮助行业朋友的“超级一人公司”[4] - 作者强调在AI加持下,个人能力边际得到提升,使得一人运营多个平台成为可能[19][20] AI自媒体运营与成果 - 在即刻平台拥有近25,000名粉丝,被视为相当高的粉丝量[6] - 在Twitter平台粉丝量达到11万,作者认为该平台是获取AI行业前沿信息的关键渠道[10][12] - 微信公众号粉丝量从年初的1万多增长至约7.8万,目标是达到10万以上[16] - 开始制作视频内容,在抖音、小红书、视频号等平台取得良好数据表现,包括数十万至上百万的播放量[17] - 作者认为AI洗稿能力提升导致图文内容商业价值下降,视频内容成为重要方向[17] AI社群运营与活动 - 运营付费AIGC周刊社群,会员数量(含续费)达到约2000个,被认为是中国规模较大的AI社群之一[28] - 探索新的社群推广模式,在销售社群会员的同时,联合推广国产AI产品,帮助创业者提升销售额[24][30] - 在11月初的大型活动中,与超过30个AI产品的负责人进行沟通协作,并独立负责营销方案制定和抽奖等环节[29] AI创作内容与趋势 - 在图像与视频生成领域产出大量内容,是作者涨粉最多的领域[34] - 推动“Vibe Coding”(通过自然语言生成网页)概念的普及,相关提示词被广泛引用[34] - 关注并产出关于AI Agent、MCP(模型上下文协议)等周边服务的内容[35][36] - 强化学习在工具使用及编程领域的应用,是推动2025年AI进入新阶段的关键技术之一,极大地促进了Vibe Coding和Agent工具的爆发[53] - 多模态能力的爆发是另一关键技术突破,体现在图像、视频、音频的理解与生成质量飞速提高,例如Sora 2、Veo 3.1、Nano Banana Pro、Seedream 4.0等模型[55][56] 关注的AI产品与公司 - **Medeo**:一款支持多模型、可通过自然语言进行视频编辑的AI Agent[44] - **Youware**:一个Vibe Coding工具及社区,允许用户通过自然语言创建并分享网页[46] - **Listenhub**:一个从AI音频平台进化为全面的AI创作平台,支持声音克隆、AI播客、PPT和视频生成[47] - **Chatwise**:一个整合各平台模型优势并支持工具调用的产品,让用户能简单构建Agent[58][62] - **Manus**:被认为是第一个展示通用Agent形态的产品,在Agent交互和构建方法上给行业带来启发[60] - **Claude Code**:在推动AI编程落地和人机融合工作方法上被认为具有天才设计[60] - **AI Studio的Build模式**:谷歌整合其AI模型能力的产品,几乎完全用AI模型替代后端,尤其在Gemini 1.5 Pro更新后优势凸显[61][63] 对2026年AI行业的展望 - 强化学习应用将继续进化,例如Gemini 3 Pro和Flash模型的进展[67] - 大型算力中心(如OpenAI的Stargate)建设完成,将催生更强大的模型[67] - 期待视频生成领域出现“Nano Banana Pro时刻”,即实现全面的理解、编排及编辑能力[67] - Vibe Coding将在2026年迎来其“DeepSeek时刻”,实现极大的破圈[67] - Agent产品的发展将更侧重于垂直领域,而非通用Agent[67] - 随着工具调用和上下文管理技术的突破,2026年Agent领域可能还有一次突破[68]
26岁,欧洲最年轻白手起家亿万富豪诞生了
新浪财经· 2025-12-27 18:26
公司融资与估值 - 成立仅两年的Lovable公司在新一轮融资中估值飙升至66亿美元 在不到六个月的时间里实现三倍增长 [2][3] - 公司于两周前完成3.3亿美元新一轮融资 由CapitalG与Menlo Ventures领投 Khosla Ventures、Accel、殷拓集团(EQT)等多家机构参与投资 [3] - 此轮融资使公司融资总额达到5.5亿美元 [3] 创始人财富与持股 - 35岁的联合创始人安东·奥西卡与26岁的法比安·赫丁各自持有公司约24%的股份 二人身家均达16亿美元 跻身亿万富豪之列 [2][4] - 26岁的赫丁成为欧洲最年轻的白手起家亿万富豪之一 并跻身全球仅有的13位30岁以下白手起家亿万富豪之列 [4] - 两位创始人均计划未来将退出收益的50%捐赠给慈善事业 旨在支持人类向超级智能AI平稳过渡 [4] 产品与市场定位 - Lovable推出的AI编程工具主打“氛围编程”概念 能让用户仅凭文字指令搭建网站与应用程序 [5] - 公司定位是服务基数更庞大、不会写代码的用户群体 与Cursor、Cognition等面向专业程序员的AI编程初创公司不同 [6] - 公司活跃用户数已达800万 是今年7月时230万用户的三倍多 [5] 业务增长与财务表现 - 公司上线仅8个月就实现了1亿美元的年化订阅收入 增长速度超过云安全初创公司Wiz和人力资源平台Deel [5] - 今年7月公司曾透露其订阅收入约为每天100万美元 [5] - 2023年10月公司从风投基金Hummingbird获得800万美元种子轮融资 并于2024年11月正式推出产品 [5] 行业竞争格局 - AI编程工具赛道今年迎来爆发式增长 例如Cursor以300亿美元估值融资23亿美元 Cognition以102亿美元估值融资超4亿美元 [6] - Lovable已超过直接竞争对手Replit和StackBlitz Replit于9月以30亿美元估值融资2.5亿美元 StackBlitz于1月以约7亿美元估值融资1.05亿美元 [6] - 大型科技公司纷纷入局竞争 Figma、Squarespace、Wix、谷歌、OpenAI和Anthropic均已开发或收购相关AI编程工具 [6]
YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知
36氪· 2025-12-24 11:48
模型竞争格局 - Anthropic模型份额突破52%,超越OpenAI,其增长在过去3到6个月呈现“曲棍球棒”式陡峭增长,核心驱动力在于其优秀的编写代码能力,使其成为开发人员的首选工具并渗透到其他场景 [3][20][21] - Gemini市场份额在一年内从个位数暴增至23%,其推理能力在2.5 Pro发布前已表现优异,在信息获取准确性上优于Perplexity,成为处理高可靠性实时资讯的常用模型 [4][23] - ChatGPT的记忆功能了解用户的个性、思考方式和历史背景,形成了深度定制的体验和极高的迁移成本,这使其成为面向消费端的竞争壁垒,用户难以切换到其他没有个性化积淀的模型 [5][24] - AI创业公司已不再押注单一模型,而是通过构建编排层实现技术抽象化,可根据具体任务灵活调用最擅长的模型,例如先用Gemini 3进行上下文工程处理,再将结果输入OpenAI执行 [6][26] - 市场上仍缺乏能全自动处理复杂高价值交易的深度消费类应用,导致用户和初创公司出现手动套利行为,例如同时打开多个模型标签页对比输出,或让不同模型互相审计 [7][24][26] AI基础设施与行业阶段 - 计算资源的过剩是创业者的红利,类似于九十年代末的电信泡沫,当时数百亿美元堆出的过剩带宽最终孕育了YouTube,当前英伟达、谷歌、AMD间的竞争意味着计算资源将变得更廉价充沛 [8][30] - 技术革命正从重资产的安装阶段(如2023年疯狂购买GPU和建造数据中心)向部署阶段过渡,初创公司无需参与耗钱的基建竞争,可在既有AI基础设施上构建下一代应用 [9][32] - 发电能力是AI发展的重要限制因素,由于陆地土地和电力建设速度跟不上需求,太空数据中心方案已成为谷歌和马斯克等巨头跟进的方向,YC内部公司Zephyr Fusion正在研究通过太空聚变反应堆实现吉瓦级能源供应 [10][32][33] - 2025年的AI经济已进入相对稳定的体系,模型层、应用层和基础设施层的分工明确,各方都有获利空间,基于大模型构建AI原生公司已有一套成熟的操作手册 [11][37] - 技术增长遵循对数线性的扩展定律,会逐渐遇到上限,加之人类天生具有抗拒改变的倾向,两者共同构成缓冲垫,让社会、文化和政府有足够时间消化AI技术 [12][37][38] 创业与人才趋势 - Vibe Coding在2025年已从一种创始人行为模式演变为成熟的行业类别,它让开发者关注高层逻辑和“感觉”,通过大模型快速生成代码并迭代原型,极大地提升了验证想法的速度 [13][36] - 构建模型的知识正在普及化,许多初创公司利用开源模型,结合垂直领域的专有数据集进行强化学习微调,数据证明这些针对特定垂直行业的小模型(如8B参数)在专业基准测试中可以击败OpenAI的通用大模型 [14][35] - AI时代催生了新型成功标准,即炫耀团队精简与收入高效,例如Gamma仅凭50名员工就实现了1亿美元的年经常性收入,小规模团队创造巨额收入成为AI原生公司的新常态 [15][39][40] - 十年前罕见的研究思维、工程能力及商业头脑组合人才,在2025年已大量涌现,相关构建知识分散化,稀缺技能变成通用技能,推动了更多应用型AI公司的崛起 [16][34][35] - AI在提高个人效率的同时,也拉高了客户对产品功能的期望,领先的AI初创公司依然在积极招聘,以满足不断增长的市场需求和更快的交付周期,人才竞争依然激烈 [17][38][39]
YC 年终复盘:2025 年 AI 十大真相
36氪· 2025-12-24 09:20
文章核心观点 - AI行业已从“令人眼花缭乱的混乱”阶段进入“可以实际构建产品”的成熟阶段,应用层的黄金时代正在到来 [2] 模型使用趋势:Anthropic超越OpenAI - 在YC的Winter 2026批次中,Anthropic已超越OpenAI,成为YC创业者最常使用的API,过去3-6个月内其使用率增长超过52% [3] - Claude Sonnet成为开发者在代码生成和AI Agent任务中的首选,因其在处理复杂任务时表现更稳定,API更易集成 [3] - 创业者基于专有评估指标(Evvals)选择模型,而非盲目跟随大厂宣传,许多医疗领域创业公司评估显示Claude表现优于其他通用模型 [3] 技术架构:模型编排层成为标配 - 创业公司不再押注单一模型,而是构建“编排层”来抽象化不同模型,针对不同子任务使用不同模型 [4] - 这种模型组合策略由创业公司自己的Evvals驱动,并随着新版本发布动态替换模型,降低了供应商锁定风险,优化了成本结构 [4] - 模型被视为可替换组件,真正的竞争壁垒在于应用层的差异化和对垂直领域的深度理解 [4] 开发范式:Vibe Coding崛起 - Vibe Coding在2025年从一个观察现象演变成成熟的工具类别,指开发者使用大语言模型快速生成大量代码,关注高层逻辑和“感觉” [5][6] - 这种方式大幅提升了原型迭代和产品发布速度,Replit和Amagence成为该领域代表工具 [6] - 目前Vibe Coding尚不能100%用于生产级代码,更适合快速验证想法、搭建原型及快速调整方向 [6] 团队与生产力:小团队实现高收入 - AI时代团队规模显著缩减,例如Gamma公司以50人团队实现了1亿美元的年度经常性收入(ARR) [7] - 这种“高收入配低员工数”的“反向炫耀”成为AI创业圈新身份象征,源于AI工具极大提升了单个开发者生产力 [7] - 对创业者能力提出新要求,需同时具备研究员、工程师和商业能力,这种配置正在普及化 [7] 行业结构:三层结构与基础设施泡沫 - AI经济已稳定成清晰的三层结构:模型层、应用层和基础设施层 [8] - 即使基础设施层存在过度建设(如GPU产能过剩),对应用层创业者反而是好事,因成本下降创造了更多机会 [8] - 行业正从“安装阶段”(高资本支出、市场狂热)过渡到“部署阶段”(真正的广泛价值创造),模型更新变得渐进式,为应用层建设者提供了更稳定环境 [8] 消费级应用:面临信任挑战 - 除ChatGPT外,市场上几乎没有现象级的消费级AI应用 [9] - 核心原因在于信任问题,用户不完全信任模型在没有人工监督下能准确完成高价值任务,因此更倾向于使用通用模型配合手动提示词 [9] - 这种现状可能持续,直到模型可靠性进一步提升或出现能建立用户信任的新型交互方式 [9] 模型公司:垂直领域的机会 - 领域专用的小模型(如8B参数)在特定垂直场景中有时能够击败通用大模型(如GPT-4) [10] - 这些小模型通过强化学习(RL)和在专有数据集上的微调,能在特定基准测试中表现出色 [10] - 构建和训练模型的知识已不再是稀缺资源,降低了准入门槛,但竞争也更激烈;拥有独特数据资产和深厚领域专业知识的公司有机会 [11] 基础设施前沿:太空数据中心 - 太空数据中心正从想法变为被行业认真讨论的现实方案,YC投资的Starcloud(S24批次)和Zephyr Fusion(F25批次)在探索此方向 [12] - 核心驱动因素是地球上的能源限制,太空提供了一种绕过土地和能源监管的方式 [12] - 即使短期内不现实,此方向的探索也会推动相关技术进步 [12] 行业发展预测:对数级缩放与组织惯性 - 针对“AI 2027”报告预测AI可能导致社会结构崩溃的观点,YC持怀疑态度 [13] - AI进步遵循对数级缩放规律,进步速度可能比预测的更慢、更可控 [13] - 人类和组织对变化的抵抗(组织惯性)会成为快速“起飞场景”的刹车,使AI的影响以更渐进、更可管理的方式展开 [13] 行业现状:进入稳定可构建期 - AI经济已进入稳定期,证据包括:有了相对清晰的“AI原生公司构建手册”;2024年“每周都有颠覆性突破”的狂热已冷却;市场已分化出清晰的层级结构 [14] - 这种稳定性意味着创业者可以更有信心地做长期规划,游戏规则变得更加清晰和可预测 [14]
Andrej Karpathy年度复盘:AI大模型正在演变成一种新型智能,今年出现6个关键拐点
华尔街见闻· 2025-12-20 12:41
文章核心观点 - 2025年是大型语言模型领域蓬勃发展的关键一年,出现了六个改变行业格局的“范式转变”拐点,揭示了LLM正在演变成一种全新的智能形态 [1][3] - LLM展现出独特的“锯齿状”智能特征,既是博学的天才,又像思维混乱的小学生,其潜力目前实现尚不足10%,预计未来将持续飞速进展 [1][3] - 从训练范式、智能形态到应用层、交互界面,LLM技术栈的各个层面均发生根本性变革,标志着AI应用进入新的发展阶段 [3] 技术范式转变 - **拐点一:基于可验证奖励的强化学习成为训练新阶段**:传统的LLM生产流程(预训练、指令微调、基于人类反馈的强化学习)被改变,基于可验证奖励的强化学习成为新阶段 [4][5] - RLVR通过在数学题、代码谜题等可自动验证的环境中训练,使LLM自发演化出类似“推理”的策略,如将问题拆解为中间步骤并掌握多种解决方法 [5] - 与指令微调和基于人类反馈的强化学习不同,RLVR针对客观且不可作弊的奖励函数,允许更长周期的优化,具有极高的“能力/成本比” [5] - 2025年大部分能力提升源于各实验室将原本用于预训练的算力转向消化RLVR这一新阶段的“算力积压” [5] - OpenAI o3的发布是真正的拐点,RLVR带来了通过增加“思考时间”来控制推理能力的新调节旋钮 [6] LLM智能形态认知 - **拐点二:“幽灵智能”展现锯齿状性能特征**:业界开始理解LLM是一种与生物智能完全不同的全新智能实体,其神经架构、训练数据、算法和优化压力均不同 [7] - LLM展现出“锯齿状”性能特征:在可验证领域附近能力“激增”,但整体表现极不均衡,既是博学天才,又可能被简单提示词破解 [3][7] - 这种现象导致对基准测试产生信任危机,因为基准测试本质是可验证环境,极易受到RLVR攻击,“面向测试集训练”成为新艺术形式 [7] 应用层与交互范式革新 - **拐点三:Cursor引领新一代LLM应用层崛起**:Cursor的成功揭示了“LLM应用”的全新层级,标志着垂直领域LLM应用的兴起 [8] - 此类LLM应用为特定垂直领域封装并编排LLM调用,核心功能包括处理上下文工程、编排多个LLM调用串联成复杂有向无环图、提供特定图形界面以及提供“自主程度调节滑块” [8] - LLM实验室倾向于培养通用能力的“大学生”,而LLM应用则通过提供私有数据、传感器、执行器和反馈闭环,将这些“大学生”组织成特定领域的专业从业者 [8] - **拐点四:Claude Code开创本地AI智能体新范式**:Claude Code成为LLM智能体的首次令人信服展示,它以循环方式串联工具调用和推理进行长时间问题解决,且运行在用户电脑上,使用私有环境、数据和上下文 [9] - 这种本地化、个性化的AI交互范式改变了AI的样貌,使其从被动访问的网站变为“住”在电脑里的灵体,强调了隐私保护和个性化体验的重要性 [9] - **拐点五:Vibe Coding让编程能力普及化**:2025年AI跨越关键能力阈值,使人们仅凭英语就能构建复杂程序,“Vibe Coding”概念的流行标志着编程门槛的彻底降低 [10] - 编程不再是专业人士专利,普通人从LLM中获益远超专业人士、企业和政府,代码变得免费、瞬时、可塑,用完即弃,将重塑软件生态并让创意实现的成本接近零 [11] - **拐点六:Nano Banana开启LLM图形界面时代**:谷歌Gemini Nano Banana被称为2025年最震撼、最具范式转移意义的模型,预示着LLM交互界面的根本变革 [12] - 文本并非人类偏好的信息消费格式,真正的“LLM GUI”需要以人类偏好的图像、信息图、幻灯片、白板、动画视频、网页应用等方式进行交流 [12] - Nano Banana的显著特征不仅是图像生成,更是文本生成、图像生成和世界知识在模型权重中的交织融合,提供了多模态融合能力的早期雏形 [12]