Vibe Coding

搜索文档
对话吴穹:软件开发的终局,是我们将迎来自己的“黑灯工厂”
AI科技大本营· 2025-09-15 08:50
作者 & 采访 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 三十年的软件工程江湖,像一条奔流不息的河。 有人淘金,有人摆渡,有人筑坝,而 吴穹 , 是那个试图画出河流走向图的人。 1995 年,师从杨芙清院士和梅宏院士,吴穹正在北大参与"青鸟工程",一个近乎理想主义的尝试——在中国建立一条真正的"软件工业生产线"。做学 术研究时,他内心总有一个强烈的声音在催促:如何将这些抽象的理论"落地"?毕业前夕,他找到了当时在全球软件工程领域声名赫掣的 Rational 公 司,毛遂自荐,最终竟促成了这家巨头在中国的第一个办事处。就这样,他几乎是以一己之力,将 Rational 及其方法论 RUP(Rational Unified Process) 这本"圣经"引入了中国。 那是一个"引渡者"的黄金时代。UML 统一建模语言、RUP,这些来自海外的严谨范式,如同精确的图纸,被递到了一群最渴望规范与秩序的中国工程 师手中。吴穹和他的同仁们,就像当年的普罗米修斯,将理性的火种带到东方。他亲手将 RUP 翻译成中文,免费提供给整个社区,无数 CTO 和 CIO 都曾感念,是 RUP 为他们野蛮生长的研发体系 ...
Replit hits $3B valuation on $150M annualized revenue
Yahoo Finance· 2025-09-11 00:54
Replit has raised a $250 million round, valuing the company at $3 billion. Unlike other fast-growing vibe coders, Replit has not been running to VCs every few months, though we’ll see if that changes. Its last raise was in 2023 when it raised about $100 million that valued the company at $1.16 billion post-money. Replit has now raised a total of about $478 million, PitchBook estimates. The company, founded in 2016 by programmers Amjad Masad (pictured), Faris Masad, and designer Haya Odeh, says it’s been ...
AI 研发提效进行到哪儿,谁来守住质量底线?
36氪· 2025-09-01 10:35
AI在研发中的角色演变 - AI应用经历了三个阶段演变:从辅助编程的IDE插件工具到引入Agent的"氛围编程1.0时代",再到CLI模式的"氛围编程2.0时代"[2] - 2022年底ChatGPT推出被视为AI的"iPhone时刻",此后AI迅速介入更多研发环节并影响架构设计与组织协作[1] - 当前AI已深度融入需求调研、PRD评审、技术设计、测试及CI/CD等全交付生命周期环节[4] 研发效率提升数据 - 开发岗位效率提升约30%,主要集中在代码编写和评审环节[13] - 测试岗位提效约25%,涵盖用例编写和自动化测试[13] - 运维岗位提升约25%,尤其在DevOps场景和复杂问题排查方面[13] - 头条和抖音前端团队通过AI工具将设计稿转代码时间从1-2天缩短至几分钟[5] 代码质量与规范 - AI生成代码往往比人工编写更规范,附带详细注释且接口函数遵循统一标准[9] - 超过80%的场景能通过AI自动提升单元测试覆盖率[9] - AI可辅助代码评审,进行变量命名检查、格式规范验证及生成PR总结解释[10] - 采用TDD(测试驱动开发)模式可增强AI生成代码的可控性[10] 企业级应用挑战 - AI生成代码难以直接入库生产系统,需经过严格扫描校验流程[3][6] - 算力和token消耗导致高成本,限制大规模应用落地[20] - 管理层认知偏差可能削弱企业竞争力,需科学量化提效效果[21] - 复杂业务场景中AI难以理解全局业务逻辑,需依赖领域知识库支持[16] 人机协作模式 - AI要求开发者具备更强理解把控能力,最终责任仍在工程师本人[4] - Cursor等工具通过设置checkpoint确保开发者对结果保持掌控[5] - 开发者仅30%时间用于编码,其余用于沟通协作,AI在需求设计等环节作用显著[6] - 辅助模式可带来20%-30%效率提升,优于准确率不足的Agent模式[19] 架构与组织变革 - 出现AOA(AI Oriented Architecture)新架构范式,研发组织向AI中心化转变[24] - 岗位左移(测试向开发靠拢,开发向产品靠拢)和职级上移成为趋势[22] - 前端交互向LUI(Language User Interface)转变,可能推动"无边界体验"发展[23] - 未来Web应用可能消亡,交互方式转向自然语言,企业重点提供后端服务能力[25] 未来发展方向 - AI需从"高级工程师"向"架构师"演进,具备系统理解能力和自我进化能力[26] - 需解决大模型对具体项目业务理解不足的问题,降低知识库构建成本[26] - 可穿戴设备发展可能解决AI缺乏真实世界感知能力的问题,实现研发闭环[27][28] - 全栈开发通过AI辅助变得更易实现,人机协同可快速补齐技术短板[31] 技术实现路径 - 领域知识库普遍采用向量数据库结合Embedding技术[32] - RAG、上下文增强和MCP是搭建开放生态的手段而非目的[18] - 企业需提供高质量内部语料库才能生成符合自有规范的UI代码[30] - Agentic RAG结合自我演进能力可实现更智能的检索召回[32]
硅谷 AI 大转弯与二级市场的牛市|42章经
42章经· 2025-08-31 20:35
AI行业发展趋势 - AI进入高速发展阶段 核心衡量指标从Scaling Law转变为Token消耗量 7月Token消耗量较6月增长20%以上[3] - 行业预期发生变化 从追求AGI转向优化现有智能的可用性和易用性[4] - AI已超越应用阶段 进入产业化和工业化新阶段[6] 模型发展特点 - GPT-5代表重要转折点 通过整合分散的模型能力和前端界面提升可用性而非追求更聪明[5] - 模型智能评估重要性降低 OpenAI和DeepMind模型已获得IMO金银牌[18] - 模型进入瓶颈期 智能提升主要来自各环节增量优化 仍有几十个百分点提升空间[22] 基础设施优化 - Infra优化分为四层:模型与GPU间优化 模型与应用间推理加速 Agentic Infra优化 context层Infra优化[25][26][27] - 推理加速技术壁垒不高 部分开源 毛利空间存在争议[25] - 英伟达需求来自训练和推理两部分 Token消耗增长推动推理需求持续上升[29] 公司战略演变 - 模型 应用和Infra公司边界变得模糊 出现端到端打通全链条的趋势[13][14] - OpenAI招募创业公司创始人 Google加快应用端发力 Manus开展技术工作 Cursor开始训练自有模型[13] - 公司分工新共识:模型公司提升Token价值 Infra公司优化使用效率 应用公司换取数据反馈[11] 投资市场表现 - 英伟达股价上涨核心驱动是Token消耗量持续增长[29] - ASIC厂商和AMD股价表现亮眼 反映市场对降低成本方案的追求[30][31] - 美国AI估值存在泡沫 但发展前景依然被看好[48] 应用场景发展 - RL范式推动Coding 数学等可验证效果场景发展[37] - 垂类公司找到PMF Harvey AI在法律领域实现高ARR 医疗金融保险领域出现成功团队[37] - 视频Token消耗增速远高于文字 但真正多模态原生应用尚未出现[88][89] 二级市场差异 - 美国市场受AI发展预期主导 AI对整体景气度影响占三分之二以上[45] - 中国市场受多重因素影响 包括居民存款 投资意愿 风险偏好和制造业周期[46] - 腾讯成为国内AI板块代表性标的 因AI努力程度和战略高度获得市场认可[56] 一级市场特点 - 美国模型公司估值达到上百亿美元 出现全明星团队加持现象[79] - 第一梯队与第二梯队公司估值差距创历史纪录[82] - 国内一级市场两极分化严重 头部公司可能获得十倍资金[84] 新兴公司关注 - Reddit因社区数据质量高被ChatGPT高频使用 类似美国版知乎+小红书+B站[76] - ServiceNow通过Workflow梳理和软件交付获得500强客户 增长速度加快[76] - Figma凭借协作场景优势和中生代公司地位 有望将AI融入协作场景[77]
AI 研发提效进行到哪儿,谁来守住质量底线?
AI前线· 2025-08-31 13:33
AI工具在研发流程中的应用现状 - AI工具已深度融入研发全流程 覆盖需求调研 PRD评审 技术设计 测试及CI/CD等环节 渗透率接近100% [9] - 代码生成效率显著提升 如Figma设计稿还原代码从1-2天缩短至几分钟 [9] - 开发者30%时间用于编码 70%时间用于沟通与流程 AI在需求设计 任务拆解等环节作用突出 [11] AI提效的量化表现与质量影响 - 开发岗位效率提升约30% 测试岗位提效25% 运维岗位提升25% 主要体现在代码编写 评审和DevOps场景 [18] - AI生成代码规范性优于人工 附带详细注释 接口和函数层面遵循统一规范 [13] - 单测Agent使80%场景能覆盖传统自测环节 代码评审AI辅助可检查命名 格式规范并生成PR总结 [14] 技术演进与阶段划分 - AI应用经历三阶段:IDE插件辅助编程→Cursor为代表的氛围编程1.0→CLI模式氛围编程2.0 [5][6] - Vibe Coding概念推动CLI模式发展 门槛更高但用户群体更广 定制自由度提升 [6] - 研发范式遵循EPCC流程:探索 计划 编码 提交 需分环节让AI协助 [7] 落地挑战与成本问题 - 算力和token消耗导致高成本 如用户花200美元实际消耗上万美元算力 [24] - 效果难以量化 不同用户对Claude Code和Copilot等工具感受差异明显 [25] - 管理层认知存在两极分化:传统方式推动研发或过度乐观认为AI能取代研发人员 [25] 架构与协作模式变革 - 研发组织向AI中心化转变 MCP协议应用形成AOA(AI Oriented Architecture)新架构范式 [28] - 岗位左移(测试向开发靠拢 开发向产品靠拢)和职级上移(高级岗位比例提高) [27] - 交互方式从图形化UI转向LUI(Language User Interface) 未来可能发展为"无边界体验" [27] 人机协作与责任边界 - AI不会替代工具团队 研发流程未被打破 但加速各角色效率 人需承担更高层次决策 [10] - AI对人的要求更高 工程师需对AI生成代码负最终责任 要求更强理解和把控能力 [8][9] - 初级开发者可能无法完全理解AI生成代码 出现问题时依赖AI修复反而导致反噬 [19] 未来发展方向 - AI需从"高级工程师"向"架构师"演进 具备系统理解能力和自我进化能力 [31] - 可穿戴设备普及可能解决AI缺乏感知能力问题 实现研发流程真正闭环 [32] - 领域知识库建设需结合向量数据库和Agentic RAG技术 不同业务差异显著 [36] 业务场景实践 - 电商中台团队通过领域知识库接入AI大脑 在0~1场景和老项目迭代中表现超预期 [22] - 企业UI生成需提供高质量内部语料训练 否则结果只能停留在通用层面 [34] - 全栈开发在AI辅助下更易实现 程序员可通过解释模式和TODO项补齐能力短板 [35]
a16z 全球 AI 产品 Top100:DeepSeek 增长放缓,「中国开发,出海全球」成为新常态
Founder Park· 2025-08-28 19:13
生成式AI应用生态系统稳定性 - 生态系统趋于稳定 换血速度明显放缓 网页端新上榜应用11款 移动端新上榜应用14款 相比第四版榜单网页端17款新上榜的情况有所减少 [2] 中国AI应用全球表现 - 网页端中国应用包括Deepseek第3名 Quark第9名 豆包第12名 Kimi第17名 Qwen第20名 Lovable第23名 Manus第31名 可灵第33名 海螺第45名 Monica第49名 SeaArt第19名 Cutout Pro第34名 [4] - 移动端中国应用包括豆包第4名 百度第7名 Deepseek第8名 美图第9名 B612第12名 Facemoji第13名 Cici第14名 Hypic第16名 Wink第17名 BeautyPlus第32名 BeautyCam第34名 Gauth第40名 Quark第47名 Airbrush第49名 [4] - 中国开发出海全球成为新常态 网页端榜单大部分产品在中国开发后出海 绝大部分用户来自其他国家 移动端Top 50中22款应用在中国开发 主要用户遍布全球 [8][32] - Manus年化收入达9000万美元 流量来源多元化 巴西排名第一 美国其次 [32] - 美图公司5款应用上榜 字节跳动推出多款面向全球产品 [8][32] 主要厂商竞争格局 - Google旗下四款产品进入网页端榜单 Gemini网页端访问量达ChatGPT的12% 移动端月活接近ChatGPT的一半 近90%月活用户来自Android平台 [8][11] - Grok移动端月活超过2000万 7月新模型Grok4发布及AI伴侣头像功能上线后移动端用户量大幅增长近40% [8][18][19] - DeepSeek增长显著放缓 移动端月活从峰值下滑22% 网页端较2025年2月峰值下降超过40% [8][25] - Meta AI增长平缓 网页端排名第46 未进入移动端榜单 2025年5月下旬亮相后增长速度远慢于Grok [22] - Perplexity网页端和移动端保持强劲增长 Claude网页端持续增长 [25][26] 应用类别分布 - 三类应用主导市场:通用聊天助手 创意工具 AI陪伴类应用 [34] - 陪伴类产品三款新上榜:Juicy Chat Joi和Ourdream Characterai JanitorAI SpicyChat PolyAI CrushOnAI和CandyAI仍在榜 [34] - 创意类工具涵盖图像 视频到音频生成 包括Midjourney PhotoRoom Leonardo Cutout Pro Veed和ElevenLabs [34] Vibe Coding赛道发展 - Vibe coding类应用用户粘性极高 某顶级平台美国用户群在注册后几个月内保持超过100%收入留存率 [39] - 带动周边工具流量增长 如数据库提供商Supabase流量增长与核心vibe coding平台崛起同步 过去九个月显著加速 [41] - Lovable和Replit首次进入主榜单 Bolt进入Brink List潜力榜 [36] 常青树企业分析 - 14家公司五期榜单始终在榜 横跨通用助手 情感陪伴 图像生成 图像视频编辑 语音生成 生产力工具及模型托管领域 [44][47] - 仅5家拥有自研基础模型 7家依赖API或开源模型 2家为大模型聚合平台 [48] - 除Midjourney和Cutout Pro外均获得风险投资 来自美国 英国 澳大利亚 中国和法国 [50] - 如不包含第一次榜单 还有5家可入选All Stars:Claude DeepAI JanitorAI Pixelcut和Suno [53]
Karpathy氛围编程最新指南,三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro
36氪· 2025-08-26 09:31
AI编程工具分层结构 - 提出三层AI编程结构:第一层Cursor负责自动补全与小范围代码修改(75%使用频率)[3][9],第二层Claude/Codex用于较大功能块实现与快速原型开发[5][8],第三层GPT-5 Pro解决最棘手bug与复杂抽象问题[4][5] - 工具选择策略基于任务复杂度:简单局部任务用Cursor,中等功能用Claude/Codex,极端难题用GPT-5 Pro[4][13] - 结构源自实战经验,强调工具按频率和任务类型组织[4] 高带宽沟通与实施方法 - 通过代码片段或注释直接展示任务意图,实现高效信息传递[7] - 对具体代码高亮后请求修改,避免纯文字描述的低效性[7] - 在大型项目中需将相关内容塞入上下文,小型项目则直接包含所有文件[16] 工具优势与适用场景 - 在陌生领域(如Rust、SQL)不可或缺,能快速生成一次性可视化或调试代码[11] - 节省重复劳动,支持快速原型开发和跨领域代码尝试[5][11] - GPT-5 Pro能挖掘深奥文档论文,处理文献综述和抽象结构清理[13] 当前局限性及改进需求 - 模型易跑偏,需常按ESC终止,避免全面托管模式[12] - 代码质量存在问题:滥用try/catch、抽象过度复杂、代码膨胀(如嵌套if-else替代列表推导)、重复代码而非使用辅助函数[12] - 需手动清理编码风格问题,缺乏The Zen of Python美感[12] - 交互性局限:模型倾向于写代码而非解释原因[12] 开发者实践与社区反馈 - 网友验证分层有效性:小问题靠AI补全,大问题靠多模型尝试并人工监督[15] - 模型切换成为艺术,不同模型针对特定任务效果差异显著[17] - 确保代码一致性需提供详细需求说明、功能拆解及验收标准(含代码风格规范)[19] - 开发流程建议:求思路优缺点分析→写第一版代码→复查API文档→测试→提交→迭代循环[16] 行业影响与概念演进 - 提出"代码后稀缺时代"概念,代码可随意创造删除[12] - Vibe Coding指南从1.0持续迭代,避免沦为概念游戏[13] - 工具可能性拓展引发开发者焦虑,需通过社区交流推动集体进步[13][14]
Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro
量子位· 2025-08-25 23:47
AI编程三层结构框架 - Karpathy提出AI编程的三层递进结构 将编程任务按复杂度和工具特性分为三个层级进行分配[1][3] - 第一层使用Cursor处理约75%的常见情况 通过Tab键自动补全代码和小范围修改[9] - 第二层使用Claude Code/Codex实现较大功能块 特别适用于开发者不熟悉的领域如Rust和SQL语句[14][16] - 第三层使用GPT-5 Pro解决最棘手问题 如复杂bug修复和深度文档研究[4][20] 工具配置与使用策略 - Cursor支持配置多模型 包括claude-3.5-sonnet、gpt-40、gpt-5等主流AI编程模型[15] - 采用"顺境Cursor 逆境Claude/Codex 绝境GPT-5 Pro"的分层调用策略[6][7] - 通过代码片段或注释实现高带宽沟通 比文字描述更高效传递任务意图[11][12] 当前AI编程工具的局限性 - 模型容易跑偏 需要频繁终止任务 不适合全面托管模式(YOLO模式)[16] - 生成代码存在质量问题 包括滥用try/catch 代码膨胀 重复代码块等问题[17] - 缺乏解释性和交互性 工具更倾向于写代码而非解释代码逻辑[18][19] 开发者实践经验 - 网友使用统计显示约80%为自动补全 18-19%为功能添加 很少用于bug修复和重构[28] - 零样本新功能生成效果不稳定 通常需要大量清理工作[28] - 全自主模式表现最差 需要高度监督才能产出有用结果[28] 社区反馈与优化建议 - 开发者建议提供详细需求说明和功能拆解 附验收标准确保代码一致性[31] - 推荐采用增量式开发流程:需求分析-思路生成-代码实现-复查测试的循环[25] - 模型间切换已成为一门艺术 不同模型针对特定任务表现差异显著[29]
氛围编程行不通,CTO们集体炮轰AI编程:不是失业,而是失控
36氪· 2025-08-25 09:13
文章核心观点 - 一线技术负责人普遍认为氛围编程(vibe coding)在生产环境中存在严重风险,可能导致系统崩溃、安全漏洞和技术债务,而非宣传中的生产力革命 [1][2][3][4] - 生成式AI工具虽能快速产出代码,但缺乏对业务逻辑、系统架构和复杂场景的理解,无法替代人类工程师的决策和调试能力 [4][10][13][14] - 生产级软件开发需要结构化方法,包括代码审查、规范文档、测试体系和上下文理解,而非依赖AI的直觉式输出 [13][22][24][25] 技术风险案例 - Let Set Go团队因AI生成数据库查询导致真实流量下系统瘫痪,问题源于底层架构而非语法错误 [3] - Cirrus Bridge的新人使用AI拼凑代码导致权限逻辑错误,已注销用户仍可访问后端工具,修复耗时两天 [3] - AlgoCademy的核心搜索功能因AI编写二分查找存在隐蔽错误,导致生产系统宕机和用户流失 [4] - App Makers LA的认证流程因AI生成代码缺乏逻辑模型,在多角色权限需求下崩溃,最终需重写 [4] - Akveo项目完全依赖AI编码虽加快MVP交付,但代码不可读、难调试和维护,长期成本高昂 [4] 生产环境特性 - 生产环境要求99.99%可用性,需处理GB级数据流和复杂涌现行为,AI生成代码难以满足可靠性要求 [10][13] - 每行AI生成代码均需维护和调试,增加系统负担,最佳实践是减少代码量而非追求生成比例 [14] - 复杂系统存在独特怪癖(如仅特定人员理解的逻辑),模式化AI输出无法适配真实场景 [18][19] 软件工程本质 - 软件工程师的核心工作是决策(架构、包引用、权衡)而非仅编写代码,需理解业务逻辑和系统上下文 [13][20] - 关键技能包括代码审查、版本控制、单元测试和渐进式部署,AI工具需融入现有工程体系 [22][25] - 历史表明技术变革(如DevOps、云计算)未淘汰职业,而是提升抽象层级和工程师价值 [11] AI编码改进方向 - 需为AI提供结构化上下文:统一编码规范、可复现环境、清晰功能边界和任务定义 [24][25][30] - 建议采用"定义-创建-优化"循环:通过文档规划任务,AI生成后人工微调迭代 [31] - 需区分代码风格差异与质量缺陷,避免过度追求输出一致性 [29] - 需开发更智能的代码审查工具,当前按文件字典序审查的方式效率低下 [25][26] 行业专家观点 - GitHub等公司工程师实际工作高度受限(如六个月仅开发一个按钮),AI生成代码空间有限 [10] - Stack Overflow创始人强调"最佳代码是不存在的代码",减少代码量可降低维护负担 [14] - Augment Code团队认为上下文理解是AI编程关键,但无法替代对生产系统的关注 [22]
Cognizant's "Vibe Coding" Event Sets GUINNESS WORLD RECORDS™ Title
Prnewswire· 2025-08-21 20:00
公司活动与成就 - 公司成功举办全球最大规模在线生成式AI黑客松 参与人数达53199人并创造吉尼斯世界纪录[1][2] - 活动覆盖40个国家 涉及人力资源、销售、工程、财务、法律、营销和交付等多个业务职能部门[1][3] - 活动产出30601个可运行原型项目 包括人力资源健康伴侣应用和品牌合规检查工具等创新方案[1][2] 技术合作与平台支持 - 活动采用"氛围编程"模式 通过与Lovable、Windsurf、Cursor、Gemini Code Assist和GitHub Copilot等合作伙伴平台实现[3][5] - 合作伙伴强调AI工具降低创新门槛 GitHub Copilot助力团队加速创意落地 Cursor被开发者选为顶级工具之一[5] - Windsurf平台支持大规模参与 预示未来代码产出量可能提升100倍[5] 人才培养与社区建设 - 公司成立全球氛围编程社区 注册人数超25万人 将持续分享工具、教程和创新突破[6] - 社区将作为内部创新和客户AI解决方案的孵化平台 强化企业AI原生能力建设[6] - 公司此前承诺10亿美元AI投资 并通过Synapse计划计划在2026年前为100万人提供包括AI在内的数字技能培训[7] 战略意义与行业影响 - 首席执行官表示该倡议旨在为AI经济设定节奏 构建人人能用AI创新的 workforce[5] - 活动被合作伙伴评价为"未来工作的预演" 使非技术人员也能独立创建原型产品[5] - 公司通过该活动展示其在推动AI赋能经济方面的深度承诺 强化专业服务行业领导地位[6][7]