Workflow
Vibe Coding(氛围编程)
icon
搜索文档
昔日王者应用商店,将死,OpenClaw或杀死80%手机应用
36氪· 2026-02-03 19:32
OpenClaw (Clawdbot) 的产品定位与核心能力 - 公司创始人Peter Steinberger将OpenClaw定位为“电脑里的怪异朋友”,而非简单的ChatGPT套壳工具,强调其是“挣脱锁链的怪兽”,具有更高的自主性和能力上限 [3] - 该AI产品能够直接操控用户的文件系统、终端和浏览器,在获得权限后可以执行用户能做的任何事 [5] - 其核心特点是“极度足智多谋”,具备强大的自主学习和问题解决能力,例如在未被明确编程的情况下,能自动处理音频消息,通过查找工具和API自行完成转码与理解 [11] OpenClaw 的实际应用与颠覆性案例 - 公司展示了其产品在真实场景中的强大自动化能力:例如,仅通过一张Bug截图,OpenClaw就能自动完成从理解问题、检查代码仓库、修复代码、提交更改到回复用户的完整流程 [7] - 产品已深度集成到创始人的数字与物理生活中,控制着邮件、日历、文件、智能家居设备(如灯光、音乐、摄像头、智能门锁)等,其自主配置和操作能力达到了类似电影《2001太空漫游》中HAL的水平 [12] - 在复杂任务处理上,产品能模拟人类操作浏览器,完成包括信息提取、表单填写、验证码处理在内的全流程,例如在航空公司网站完成值机操作 [13] 对现有移动应用生态的颠覆性预测 - 公司创始人预测,手机中80%的应用程序(APP)未来将被AI助手取代,因为这些APP的功能可以通过与像OpenClaw这样的AI进行自然语言交互来更高效、个性化地实现 [1][16] - 其逻辑在于,AI助手以聊天为界面,比传统APP更自然便捷,并且能通过持续互动深度了解用户偏好,无需重复设置,从而在睡眠监测、健身提醒、购物比价等多个场景替代单一功能APP [16] 用户社区与创新应用场景 - 用户社区开发了多样化的应用场景,将OpenClaw用作家人、室友或助理,功能包括管理家庭日程、同步兴趣点、收藏社交媒体内容、生成待办列表、监控健康数据、管理密码等 [14][15] - 更具体的应用包括让AI助手帮忙记账、安排健身计划、购物,甚至监控孩子作业,并能通过识别照片中的食物来估算卡路里并进行个性化提醒 [15] 技术理念与编程范式变革 - 公司倡导一种极简的AI编程和工作流,摒弃了复杂的计划模式、MCP(模型上下文协议)、编排器或子代理等“最佳实践”,主张直接与AI对话来解决问题 [17] - 这种方法催生了“氛围编程”(Vibe Coding),即开发者通过与AI持续对话、迭代想法来共同完成项目,人的创意和直觉(Human-in-the-loop)变得比具体的编程技能更重要 [24][25] - 该产品极大地降低了编程门槛,使得非技术人员(如未使用过GitHub的普通人、前律师)也能通过自然语言指令完成代码编写、调试甚至提交Pull Request,将复杂的技术细节隐藏起来 [20][21][23][25] 产品面临的安全挑战 - 尽管功能强大,但产品存在显著的安全风险,包括可能泄露个人信息,以及容易受到“提示注入”攻击 [26] - 根据安全测试,在信息提取测试中,系统提示词在第一轮对话中就泄露了,提取成功率高达84% [26] - 在对抗性测试中,针对23次提示注入攻击尝试,成功了16次,注入成功率高达69.6% [29] - 早期用户承认这是“与安全性的权衡”,但仍尝试将其用于管理家族企业,处理发票、库存和客户联系等业务 [30]
2026第一个月,AI小小游戏爆款扎堆:谁干的?
36氪· 2026-01-15 09:26
文章核心观点 - AI驱动的文字型小游戏(如《大厂模拟器》《赛博徒步:生死鳌太线》)在2026年初意外走红,其核心在于“氛围编程”(Vibe Coding)技术大幅降低了游戏开发门槛与成本,并催生了一个依赖创意和社交传播的新兴游戏品类[1][3][4][6][8] 行业背景与驱动因素 - 游戏制作成本与门槛显著降低,AI能快速制作资产,但玩法和系统仍需人工设计,因此系统简单的游戏成本更低、完成更快[4] - 约从2025年下半年开始,“氛围编程”(Vibe Coding)概念兴起,开发者无需掌握编程语法,仅通过自然语言描述感觉即可指挥AI编写代码,彻底摧毁了游戏制作门槛[6] - 支持Vibe Coding的主流AI大模型包括Claude Opus 4.5、Gemini 3 Pro和chatGPT 5.1 codex max,相关教程在开发者社区中大量涌现[6] - Vibe Coding天生适合系统复杂但画面简单的文字型RPG,AI主要参与生成游戏系统和数值玩法,开发者只需提供创意和故事即可快速产出[8] 产品特性与用户吸引力 - 游戏形态极为轻量,仅需一个网页链接即可开玩,加载速度比主流小游戏更快,降低了用户的尝试门槛和心理负担[12] - 游戏外表简单,让用户感觉不像在“玩游戏”,而更像刷网页测试题,适合碎片化时间“摸鱼”[12] - 游戏具有高可重复游玩性和强社交性,不同选择导向不同结果,促使用户尝试各种点子并自发在社群中传播[12] - 以Deepseek为代表的免费“国民级AI大模型”出现后,催生了被称为“AI文游”的新游戏生态,拥有相当规模的用户基数[13] - AI文游通常由开发者编写提示词,定义世界观和故事开头,AI根据玩家行为动态生成剧情和数值变化,每次交互都需调用API[18] - 在小红书等平台,AI文游 话题帖子数量大、讨论多,已形成规模可观的圈子,并有专注该领域的博主出现[18] - AI文游开发者常将写好的提示词制成PDF,以极低价格(如2-3元)售卖,游戏以女性向题材为主,涵盖古风到赛博朋克,并可提供定制服务[18][20] 市场现状与竞争格局 - 此类游戏被称为“小小游戏”,具备小游戏的所有优点且更极致:成本更低、加载更快、玩法更简单、氛围更轻松、社交传播度更强[21] - 但其用户存在门槛,依赖固定圈层传播或通过熟人口碑、热点话题破圈,难以快速大规模吸引用户[21] - 商业化模式仍在探索中,《生死鳌太线》尝试售卖特殊游戏分支选项剧情,类似DLC的思路[21] - 开发者一旦产生好点子,从利益最大化角度,仍倾向于将游戏做得较为精美以增强竞争力[5] - 使用Vibe Coding制作的产品多为以玩法为卖点的小游戏,系统简单易被竞争者快速模仿[4] 未来发展趋势 - 未来发展方向可能包括探索女性用户居多的AI文游圈层,并搭配适当数量的图片资产作为奖励[22] - AI文游圈的开发者正积极尝试使用Vibe Coding制作全新形态产品,可能与热点话题类文字游戏形成合流[22] - Vibe Coding技术不仅限于文字RPG,随着AI技术发展,小游戏领域可能在2026年诞生更多新玩法品类,形成新趋势[22]
中国Coding Agent最大融资浮现,蚂蚁、凯辉、锦秋等投了
36氪· 2026-01-14 21:13
公司概况与市场地位 - 公司DeepWisdom是国内Vibe Coding(氛围编程)赛道的隐形冠军,其产品MetaGPT-X(MGX)是国内该领域用户规模最大的产品[7][11] - 公司旗下拥有多个知名开源项目,包括GitHub上近60k stars的多智能体框架MetaGPT,以及5名成员3小时复刻Manus的OpenManus[9] - 公司在2025年上半年连续完成两轮融资,投资方包括蚂蚁集团、凯辉基金等,总金额约2.2亿元人民币[12] 核心产品与商业表现 - 多智能体Vibe Coding产品MGX于2025年2月发布,0投放下一个月内实现全球50万注册用户和100万美金ARR(年化收入)[9] - 截至2025年9月,MGX月访问量达120万,每天生成应用数量超过1万[10] - 2026年1月,公司发布新一代产品并更名为“Atoms(原子)”,其特点是能内嵌登录、数据库、支付等系统,5分钟交付可直接上线运营的完整网站[15] 产品技术优势与特点 - Atoms通过多智能体(Agent)协作,实现从需求调研、文档定义、原型设计到代码开发、数据分析的完整产品开发流程[19] - 产品内置名为“Iris”的研究Agent,其研究能力在官方评测中超过Gemini-2.5-Pro、OpenAI、Kimi和Perplexity[21][25] - Atoms内嵌名为“Sarah”的SEO Agent,能为构建的产品构建自动化SEO策略以获取自然流量[22] - 公司宣称Atoms可以用20%的成本,达到超过市场竞品45%的效果,性价比高于Lovable、Replit等竞品[15][38] 发展路径与核心理念 - 公司信奉“学术循环”理念,强调持续学术积累是爆发性成功的基础,已向NeurIPS投稿9篇论文,中稿5篇,其中3篇入选Oral汇报环节[13][24] - 公司发展路径从开源验证到闭源商业化:通过开源项目MetaGPT(GitHub 58.8k stars)验证多智能体协作理念,为商业化产品MGX/Atoms打下技术口碑和社区基础[30][33] - 商业化产品MGX在现金流吃紧、服务器和模型赊账的困难条件下,依靠前期积累的口碑实现超预期增长[34] 行业洞察与公司战略 - 公司认为AI Coding赛道当前多数产品是“玩具”,关键在于无法端到端实现前后端开放及打通第三方支付等系统,而Atoms旨在解决此问题,开发可直接上线运营并获利的产品[17][18][23] - 公司不迷信“1人公司”或“10人公司”的神话,认为AI赋能意味着竞争强度(“卷度”)只升不降,AI创业公司会更“卷”,并以竞争对手Lovable在8个月内团队规模从15人扩张至45人为例[44][47][48] - 公司自身团队已有80多人,预计2025年底扩张至100-120人,认为保持高效灵活的关键在于管理,并致力于用AI解决组织管理的痛点[50][51] 组织管理与人才策略 - 公司内部成立了一个名为“ROOT”的实验性组织,由不到15名核心“通才”员工组成,他们负责从前端、后端到算法、测试的全栈开发,以避免传统分工的冗长需求传递[55] - 公司多数核心成员来自用户社区和创始人发起的Mini Hackathon,认为用户在产品实操中的表现比简历更能体现“通才”能力、批判性思维和自驱力[56] - 公司即将在硅谷设立海外办公室,主要目的是在全球范围内寻找更多“通才”,并认为第一梯队AI公司的竞争在未来很长一段时间内依然是“人效的竞争”[57]
AI编程迎全球大厂密集布局 对话亚马逊云科技Jeff Barr:未来个体开发者或将能撑起10亿美元估值
每日经济新闻· 2025-10-24 20:18
行业趋势与市场热度 - 2025年下半年AI编程赛道在全球科技圈呈现爆发式增长,成为AI商业化落地的急先锋[1] - 全球市场由头部玩家引爆,Anthropic于2025年9月完成130亿美元F轮融资,估值飙升至1830亿美元,较半年前增长3倍[1] - 国内市场进入竞速期,阿里巴巴、腾讯、字节跳动等大厂与创业公司在2025年以来密集推出独立IDE产品[1] - AI编程作为核心赛道吸引大量资本涌入,头部企业估值持续攀升,初创公司凭借细分场景解决方案快速获得融资[3] 技术变革与影响 - AI驱动的工具并非取代开发者,而是帮助其更高效工作,是过去20年来技术领域最剧烈的变革[1][1] - AI是开发者能力的放大器,这种放大效应正在改写编程的底层逻辑[2] - 新兴的Vibe编程模式让非技术背景者也能快速构建应用原型,大语言模型彻底颠覆了开发门槛[2] - 开发者能力模型重构,从过去只需和机器对话转向未来需精通人际沟通,更多转向需求挖掘、方案设计等高价值环节[3] - AI原生应用依然植根于云服务土壤,灵活、安全、可扩展仍是核心诉求[3] - AI Coding将带来第三次也是终极的范式突破,代码的终极用法是实现自我运行,从而达成AGI[3] 商业模式与行业冲击 - AI工具使企业自研成本大幅降低,越来越多甲方选择自建而非采购,倒逼商业软件公司转型服务提供商[5] - 开发者与客户可面对面协作,从规范到产品的转化极其便捷,某些应用甚至可以是一次性的,用完即弃[5] - 借助AI工具,个体开发者有望打造出估值10亿美元的公司,使"单人独角兽"从概念走向可能[1][3] 中国市场发展与挑战 - 中国市场呈现出独特发展路径,北京、深圳等科创中心聚集大量创业公司,在垂直行业解决方案、本地化适配等方面形成优势[6] - 中国企业从最初对云计算的好奇到如今全面拥抱云与AI能力,进展令人敬佩,并与全球化需求形成共振[6] - 中国软件行业面临付费能力与知识产权保护两大核心问题,AI并未解决,使得行业难以摆脱低价竞争泥潭[4] 开发者能力要求与未来展望 - 未来顶尖开发者需兼具技术深度、沟通能力与AI协同素养,AI思维是一种更具雄心和远见的思维方式[6] - 过度依赖AI工具可能导致开发者无法真正理解自己代码的意义、影响及运作方式[6] - 成功的开发者需保留核心技术能力,紧跟技术发展趋势,并打磨非常强的人际沟通技巧[6] - 云和AI的组合让个人开发者拥有更大的控制力和能力,未来10年技术发展前景令人振奋[7]
Ruby on Rails 之父 DHH 预言:未来“写代码”会变成不合时宜的念头!
AI科技大本营· 2025-05-14 17:31
氛围编程(Vibe Coding)概念 - 前OpenAI研究员Andrej Karpathy提出"氛围编程"概念,展示即使不会Swift也能靠AI在一小时内开发iOS应用[1] - AI辅助编程已成趋势,开发者工具Cursor正挑战VS Code地位[3] - 腾讯推出AI编程助手CodeBuddy,是中国首个支持MCP协议的代码助手[3] 氛围编程的商业化案例 - 开发者利用氛围编程在30天内打造AI产品,实现$7,000月收入(MRR)[5][7] - 项目开发仅用AI工具完成全流程:Cursor构建+AI冷启动邮件投放+ChatGPT/Gemini获取市场洞察[7] - 策略核心为AI全流程闭环,单人即可完成创业流程[8] 行业争议与观点 - Ruby on Rails创始人DHH认为AI应作为辅助工具而非完全外包,强调编程本身应具有乐趣[11][13][15] - 开发者反驳称AI能处理重复代码,让人专注核心逻辑;现实工作中技术债问题使AI成为必要工具[18][21] - 市场压力迫使开发者使用AI提升效率,否则可能失去竞争力[23] - AI降低编程门槛,使非程序员也能参与创作,实现"人人都是开发者"[24] 技术哲学视角 - 编程语言本质是抽象层,AI只是抽象过程的延续[22] - 资深工程师认为AI可作为合作者,但人类仍需掌握主导权[25] 行业动态 - 腾讯入局AI编程领域,CodeBuddy具备Agent智能体和MCP协议支持[3] - 开发者社区涌现AI工具组合创业案例,验证氛围编程的商业可行性[4][7]
OpenAI复制吉卜力,大模型正在吞噬一切产品?
创业邦· 2025-03-28 18:32
GPT-4o文生图功能升级 - OpenAI发布GPT-4o文生图功能,付费用户可直接在ChatGPT调用生成和修改图片,无需使用DALL-E模型[4] - 新功能发布后迅速流行,宫崎骏吉卜力画风成为最热门生成风格,部分源于OpenAI创始人演示引导[7] - 相比竞品,GPT-4o在图像文字生成、细节一致性等方面表现更优,显著超越Midjourney和Stable Diffusion等对手[7] 技术实现与优势 - 采用全模态架构和自回归生成方法,区别于传统扩散模型技术[13] - 大幅提升文本-图像对齐能力,能准确理解复杂提示词中的多对象关系和属性描述[14][16] - 可能采用"组合-分解式"生成方案解决传统模型颜色混淆等问题[16] - 控制门槛降低,用户可用自然语言指令替代复杂提示词工程[10] 行业影响与竞争格局 - 直接冲击文生图创业公司,原有调优算法和工作流程被大模型更新取代[10] - Midjourney等公司面临挑战,其基于CLIP模型和社区反馈建立的商业模式受到威胁[21] - 大模型能力持续进步可能使垂直领域优化产品失去存在价值[22] - 行业未来格局取决于技术演进方向,可能向资源集中的大公司倾斜[23] 多模态应用扩展 - GPT-4o具备处理文本、视觉、音频等多模态数据能力,但目前尚未完全开放所有功能[13] - 类似编程领域的"氛围编程"趋势,文生图领域也出现专业化流程简化的现象[10][19] - 大模型正在吞噬依赖它的应用层,从代码生成到图像创作均呈现此趋势[17][20]
OpenAI 复制吉卜力,大模型正在吞噬一切产品?
晚点LatePost· 2025-03-27 22:45
GPT-4o文生图功能的技术突破 - GPT-4o整合了文本、视觉、音频等多模态数据训练,具备生成文本、图像、音频和视频的复合能力[14][16] - 采用自回归技术生成图像,区别于主流扩散模型,实现从左到右、从上到下的顺序生成[16] - 文本-图像对齐能力显著提升,能准确理解复杂提示词中的多对象关系和属性描述[17][18] - 可能采用组合-分解式生成方案,分步生成元素后融合,避免传统端到端模型的颜色混淆等问题[18] 产品体验与行业影响 - 操作门槛大幅降低,用户可用自然语言指令修改图像,无需复杂提示词工程[12] - 图像细节一致性优于竞品,文字生成准确率提升,修改图片时能保持画面逻辑[6][8] - 直接冲击Stable Diffusion等开源模型的插件生态,部分创业公司的调优工作流被替代[12][20] - 资深设计师反馈复杂工程化流程被简单对话界面取代,AI领域呈现"模型碾压工作流"趋势[21] 行业竞争格局变化 - Midjourney等垂直领域公司面临挑战,其基于CLIP模型构建的审美优势可能被大模型覆盖[21] - 技术演进方向决定生态主导权归属,持续进步的大模型可能成为终极产品形态[22] - YC孵化项目中25%采用Vibe Coding模式,95%代码由大模型生成,反映开发范式转变[20] - 编程领域已显现类似趋势,GitHub Copilot年收入破1亿美元,但面临基础模型能力上移的挤压[19][20]