Vibe Coding
搜索文档
PM 的 AI 工具两层论:效率层让你更快,能力层让你更强
深思SenseAI· 2026-03-30 08:35
AI工具对产品经理工作流的变革 - 文章核心观点:AI工具分为效率层和能力层,效率层工具加速了产品经理的日常工作,但未改变产品开发的核心依赖链条;能力层工具(如Vibe Coding)则能改变工作本质,使产品经理能够跳过传统交接环节,直接从意图到可运行原型,从而突破效率天花板 [3][7][10] AI工具栈的四个主要板块 - 写作与沟通:工具如Claude、Notion AI、Grammarly,用于撰写PRD初稿、浓缩调研笔记、翻译技术语言,其作用在于消除空白页恐惧症,但不替代思考 [5] - 调研与洞察:工具如Dovetail、Maze、Perplexity,可自动总结访谈记录、聚类反馈主题,将竞品分析从几小时缩短到几分钟,帮助快速识别用户痛点 [5] - 路线图与优先级:工具如Productboard、Aha!、Linear、Jira,能自动聚类客户反馈、按预设标准为功能打分、为不同受众生成路线图摘要 [5] - 会议与协作:工具如Granola、Otter.ai、Fireflies、Gemini,提供自动转录、生成会议摘要、提取行动项的功能,旨在减少记录时间,增加跟进时间 [5] 效率层工具的局限性 - 效率层工具虽然加速了产品开发链条的每一步(如写文档、做调研、管路线图),但产品经理仍被卡在依赖链中,需要等待设计、工程验证和产能排期 [7][8][9] - AI工具带来的“更快”与工作流的“不同”是两回事,当前大多数产品经理的工具栈停留在效率层,底层工作流未变,瓶颈在于从想法到可验证产物的距离 [15][16] 能力层工具带来的范式转变 - Vibe Coding(如Replit Agent 4)作为能力层代表,允许产品经理用自然语言描述意图,直接生成可运行软件,将表达产品意图的核心技能转化为直接构建产品的能力 [10][11][12] - 这种转变使产品经理能够跳过传统交接环节,例如:自主构建交互原型测试想法、建立内部数据看板、制作demo级产品流程供评审、在正式设计前探索UI方案,从而减少在等待和对齐上的时间消耗 [13][14][15] 对产品经理技能与工作方式的影响 - 产品经理的核心技能被重新定价,清晰表达产品意图(描述行为、约束、预期结果)的能力,从撰写文档的技能转变为直接构建产品的技能,其价值在Vibe Coding时代将大幅提升 [15] - 建议采取“效率层+能力层”的混合工具栈策略,保留现有效率工具,同时引入一个Vibe Coding工具,选择因工程产能不足而搁置的想法进行原型构建,作为低成本试水方式 [15]
访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
晚点LatePost· 2026-03-29 22:25
文章核心观点 - AI Agent交易平台MuleRun认为,以Claude Code为代表的通用智能体能力已足够强大,当前的关键是**极致降低Agent的创作门槛**,让非技术背景的专家能将其线下知识和流程封装成Agent,从而催生一个极度丰富和长尾的AI应用生态,而平台的核心价值在于提供连接供需的交易市场、优质的运行时环境和清晰的Skills [5][10][15] - 随着技术演进,AI应用的开发模式正变得像“3D打印”一样分散和定制化,可能颠覆传统集中式、高成本的软件开发模式,未来的软件甚至可能是“日抛型”的 [32] - 基于对Claude Code等基础Agent能力的判断以及行业趋势的观察,**未来的应用入口和交易形态将从“货架式”转变为“对话式”**,用户通过自然语言提出需求,系统自动匹配最合适的Agent来执行 [28][36] MuleRun的创业思路与产品演进 - 公司于2024年底开始构思,最初尝试做Vibe Coding产品,但发现难以与头部产品竞争,随后将方向调整为**框架中立的Agent部署与交易平台** [7][10] - 核心商业模式基于一个假设:当Vibe Coding和Claude Code等技术大幅降低开发门槛后,大量非技术背景的人可以将个人工作知识封装成Agent(AI骡子),实现自动化;面临同类问题的人可以付费使用,形成交易生态 [5][10] - 平台正式上线约三个月后,发现**供给丰富度不足、上架门槛过高**是阻碍产品达到PMF(产品市场契合点)的核心问题,因此将产品优先级调整为**极致降低创作门槛** [12][15][21] - 2026年1月,公司推出了**Agent Builder并开始内测**,其设计思路是站在Claude Code等优秀基础Agent之上,通过封装提供易用的云端编辑工具、Skills和运行时环境,让普通用户用自然语言即可构建Agent [28][33][34] - 公司团队规模约为**50人** [23] 对AI Agent行业与技术趋势的判断 - **Claude Code被认为是目前最强的通用智能体(General Agent)**,其出现启发了一种全新的Agent创作范式:只要能用自然语言描述清楚需求和工作流程,AI就能高准确率地完成,无需复杂的代码或低代码操作 [8][9][10] - 大模型的能力进步,特别是编程能力的具备,使得AI理论上可以在一到两年内完成人类在电脑上能做的所有事情,当前AI做不好的主要是沉淀在线下或人脑中的经验和知识 [10] - 行业普遍认为**2025年是Agent元年,2026年将迎来应用大爆发**,当前模型能力已能支撑做出很多新东西,但整个行业尚未完全挖掘其能力上限 [17] - 即使未来出现超级大模型或强AGI,只要人类知识仍分散在个人大脑和线下,且新需求不断涌现,专注于连接和匹配供需的Agent交易平台就仍有巨大价值 [25] - AI开发门槛降低使得为极少数人(甚至三五个人)的特定场景需求开发Agent成为可能,这将导致软件开发的组织形态变得**极其分散和长尾** [11][32] Agent交易平台的竞争格局与市场机会 - 早期市场参与者如n8n、Dify、Coze等主要在卷创作工具,但近期都在向更自然、低门槛的方向演进,例如Coze转向类似Vibe Coding Agent的方向 [18] - 与字节跳动(AnyGen)、蚂蚁集团(“灵光”)等大厂产品的区别在于:**MuleRun坚持“做出来给别人用”的交易市场逻辑和框架中立路线**,而大厂产品多倾向于构建封闭生态或内部工具 [19][20] - 创业公司在大厂重金投入AI的背景下仍有巨大机会,因为大厂的历史包袱和庞杂体系反而为外部创业公司留下了操作空间,创业公司实际对抗的是大厂内部的某个业务部门,而非整个大厂 [43] - Agent交易平台未来的形态可能类似**全球最大的劳动力外包公司**,汇聚并分发由AI驱动的生产力 [20] MuleRun的产品核心:Skills、Runtime与交易系统 - 公司的核心工作是**提供清晰的Skills和良好的运行时环境(Runtime)**,并配合一套交易系统 [14][15] - **Skills的本质是Context Engineering的一部分**,用于帮助Agent分层加载信息以处理复杂任务,避免长提示词导致模型幻觉;Skills可以是文档、工具、预写程序或API [29] - 平台将重点优化**浏览器操作和网页自动化相关的Skills**,因为许多工作都在浏览器内完成,自动化价值巨大 [31] - 作为交易平台,公司强调**交付极高的任务完成率**(如跑1000次只能错1次),为此开发了复杂的评估监控系统,并引入用户评论和退款机制来保证商品(Agent)质量 [23] - 未来的产品形态将从“货架式”市场调整为**以对话式界面为核心入口**,用户陈述问题,系统自动匹配预制好的Agent执行,货架市场降级为二级入口 [36] 对AI应用生态与商业模式的展望 - 一个足够好的提示词(prompt)具有极大商业价值,但目前未被充分商业化;在技术门槛仍存在时,连接AI能力与普通人需求的“翻译中介”能赚到钱 [15][16] - 未来的AI应用生态将**无比丰富且极度长尾**,可能满足今天看来奇怪但真实存在的需求 [12] - 类似于电商平台超越独立品牌的逻辑,未来大量垂直AI应用(如AI招聘、AI绘图)可能**长在一个统一的大平台上**,由平台凝聚生产力,而非独立发展 [27] - 这种长尾、分散的AI模式本质上是**一种制造业**,每次执行都消耗算力和token,对能源需求极大,可能倒逼可控核聚变等前沿科技发展 [33] - 公司期待在2026年看到**真正AI native的新公司出现,年收入达到五亿甚至十亿美元量级**,这标志着AI价值的大规模落地 [44]
VibeCoding:打造一人量化团队
国联民生证券· 2026-03-20 13:34
量化专题报告总结 量化模型与构建方式 1. **模型名称**:基于XGBoost的因子配置模型[4] **模型构建思路**:将量化大势研判框架中的市场环境特征与Barra因子、Alpha因子结合,利用XGBoost模型捕捉非线性关系和条件依赖,以提升因子选股效果[4][82] **模型具体构建过程**: * **数据准备**:选取A股非新股、非ST、非一字涨停、未停牌的股票[93]。自变量包括10个Barra CNE5因子、85个Alpha因子以及10个市场环境特征[82]。因变量为股票下个月的收益率[89]。 * **数据处理**:对因子进行截面zscore标准化,并用3倍标准差进行截尾处理[89]。 * **模型训练与验证**:采用滚动窗口(后改为扩展窗口)训练[89][110]。初始设置为使用5年数据(前4年训练,后1年验证),预测未来1年,从2019年滚动至2025年[89]。损失函数为MSE,并设置早停机制(连续10轮验证集损失无改善即停止)[89]。 * **关键改进**:发现XGBoost难以自动学习市场环境特征与Alpha因子之间的条件依赖关系后,显式构造了交互因子[105]。具体方法为:将10个市场环境特征分别与85个Alpha因子相乘,生成850个一阶交互因子[106]。随后进行筛选,仅保留在训练集和验证集上ICIR显著高于对应原始Alpha因子的交互因子,以控制维度[106]。 * **最终方案**:模型最终采用扩展窗口训练,并输入Barra因子、市场环境特征、Alpha因子以及筛选后的显式交互因子[110]。 2. **模型名称**:国联民生金工量化大势研判框架(行业配置策略)[70] **模型构建思路**:基于产业周期与资产特征的系统性映射定义风格资产,根据市场风险偏好对风格优先级进行分层判断,用于行业配置[70][72] **模型具体构建过程**:框架定义了五类风格资产:预期成长(gf)、实际成长(g)、盈利能力(ROE)、高股息(D)、破净/并购(B/P)[70]。在市场风险偏好存在 `g > ROE > D > BP` 的基本假设下,对市场风格的优先级进行分层判断[72]。核心是构建五个市场环境特征指标[78]: * **Δgf**(预期成长边际变化):中信细分行业分析师预期增速(fttm)排序后等分五组,取Top组中位数与Bottom组中位数的差值,经平滑后再进行差分[78]。 * **Δg**(实际成长边际变化):中信细分行业财报实际利润增速(ttm)排序后等分五组,取Top组中位数与Bottom组中位数的差值,经平滑后再进行差分[78]。 * **ΔROE**(盈利能力边际变化):中信细分行业ROE(ttm)排序后等分五组,取Top组中位数平滑后差分[81]。 * **Crowd_ROE**(ROE资产拥挤度):中信细分行业ROE(ttm)排序后等分五组,计算Top组的Beta因子暴露水平[81]。 * **Crowd_DP**(红利资产拥挤度):中信细分行业股息率排序后等分五组,计算Top组近1月成交量/近3月成交量的因子暴露水平[81]。 模型的回测效果 1. **基于XGBoost的因子配置模型(最终版)**,样本外测试期(2019-2025年)[110]: * IC均值:0.08[110] * ICIR:0.66[110] * RankIC均值:0.11[110] * RankICIR:0.88[110] * IC>0占比:71.43%[110] * G10(多头)年化收益率:28.36%[110] 2. **国联民生金工量化大势研判框架(行业配置策略)**,历史回测期(2009年以来)[72]: * 年化收益:27.81%[72] 量化因子与构建方式 1. **因子类别**:市场环境特征(10个)[82] **因子构建思路**:部分源自量化大势研判框架,用于刻画市场整体风格与状态,作为因子择时的条件变量[78][82] **因子具体构建过程**: * **Δgf, Δg, ΔROE, Crowd_ROE, Crowd_DP**:构建方法同上述大势研判框架[78][81]。 * **Market_vol20**:万得全A指数20日波动率[85]。 * **Market_vol60**:万得全A指数60日波动率[85]。 * **Position_52w**:万得全A指数价格处于过去52周的分位水平[85]。 * **Market_mom**:万得全A指数价格3个月动量[85]。 * **Market_amt**:万得全A指数成交量200日均线的趋势差分[85]。 2. **因子类别**:Barra CNE5因子(10个)[82] **因子构建思路**:采用经典的Barra风险模型因子,作为模型的基础输入[82] 3. **因子类别**:Alpha因子(85个)[82] **因子构建思路**:涵盖价格、情绪、成长、质量、价值、动量等多个维度的月频选股因子[83] **因子具体构建过程**:报告列出了85个因子的名称和类型,例如价格类的`clo_5d_60d`、`return_std_1m`,情绪类的`ivol`、`turnover_mean_1m`,成长类的`roe_q_report`、`yoy_eps_q`,质量类的`roe_q_adv`、`sp_adj`,价值类的`bp`、`ep_fttm`,动量类的`mom_1y`、`reverse_1m`等[83]。具体计算方式未在报告中详细说明。 4. **因子类别**:显式交互因子(最多850个,经筛选后保留)[106] **因子构建思路**:为了捕捉市场环境特征对Alpha因子有效性的条件影响,显式构造两者的一阶交互项[105][106] **因子具体构建过程**:将10个市场环境特征分别与85个Alpha因子逐元素相乘,生成850个交互因子[106]。公式可表示为: $$交互因子_{i,j} = 市场环境特征_i \times Alpha因子_j$$ 其中,`i` 取1到10,`j` 取1到85[106]。随后进行筛选,仅保留那些在训练集和验证集上ICIR显著高于对应原始Alpha因子的交互因子[106]。 因子的回测效果 *注:报告未提供单个因子的独立测试结果,仅提供了整合所有因子后的模型整体表现。*
让你的 ClaudeCode 秒变 Openclaw(龙虾),连接飞书、Discord 远程控制
歸藏的AI工具箱· 2026-03-05 22:14
Codepilot项目开发进展与功能 - 项目在16天内发布了40个版本,完成了220次提交,开发效率极高[1] - 项目定位已从最初的Claude Code桌面端扩展为支持一系列Agent功能的综合性工具[2] - 项目集成了Claude Code桌面端、Cowork以及OpenClaw的功能,并声称比OpenClaw更安全且更适合小白用户[2] Codepilot项目核心功能特性 - 支持飞书等即时通讯工具的远程连接[3] - 提供可视化配置界面,用于管理所有Code plan套餐[3] - 集成了由“藏师傅”编写的设计Agent和素材库[3] - 支持多个Agent并发运行,并提供分屏显示功能[3] - 内置Token使用检测看板,用于监控资源消耗[3] - 提供一键安装Claude Code的功能[3] - 支持MacOS和Windows全平台[3] 衍生开源项目:Claude-to-IM-skill - 该项目旨在将Claude Code对话远程连接到飞书、Discord等即时通讯工具,实现外部交互[4] - 核心功能包括无需编写代码,通过运行`/claude-to-im setup`命令即可完成安装与配置[6][7] - 支持三大IM平台:Telegram、Discord和飞书,用户可以任意组合启用[8] - 提供交互式配置向导,Claude会通过详细指引引导用户完成token获取等设置,降低使用门槛[8][9] - 具备权限控制功能,工具调用需在聊天中通过内联按钮明确批准[8] - 支持流式预览,可在Telegram和Discord上实时查看Claude的输出[8] - 支持会话持久化,对话在守护进程重启后得以保留[8] - 注重安全,token以`chmod 600`权限存储,并在日志中自动脱敏[8] - 可通过命令`npx skills add op7418/Claude-to-IM-skill`进行安装[11] 衍生开源项目:Claude-to-IM(面向开发者) - 该项目主要面向基于Agent SDK进行产品开发的开发者,帮助他们快速接入多个IM平台以实现远程控制[11] - 支持多平台适配器,包括Telegram(长轮询)、Discord(Gateway WebSocket)和飞书(WSClient)[15] - 实现流式预览,通过消息编辑呈现实时响应草稿,并支持按平台定制的节流策略[15] - 权限管理通过交互式内联按钮实现,可对Claude Code工具调用进行审批(允许/拒绝/本次会话允许)[15] - 采用会话绑定机制,每个IM聊天会话映射到一个持久化的Claude Code会话,并支持工作目录和模型配置[15] - 支持Markdown渲染,并针对不同平台采用原生格式化方案:Telegram用HTML、Discord用其风格Markdown、飞书用富文本卡片[15] - 具备可靠的消息投递机制,包括按平台限制自动分块、指数退避重试、HTML降级和消息去重[15] - 内置多重安全机制,包括输入验证、令牌桶速率限制(每个聊天每分钟20条)、用户授权白名单以及完整的审计日志[15] - 设计为宿主无关,通过4个依赖注入接口抽象了所有宿主依赖,不绑定特定的数据库驱动、LLM客户端或框架[15]
月入9万,已经有大学生用Vibe Coding捞到第一桶金了
36氪· 2026-02-11 21:35
AI编程(Vibe Coding)的普及与影响 - Vibe Coding(氛围编程)概念在2025年由OpenAI联合创始人提出,其核心是让人们几乎忘记代码本身存在也能开发应用,并已成为全球热潮[4][5] - 该技术门槛极低,应用案例广泛,包括二年级小学生制作游戏、退休老人开发小程序,以及出租车司机等普通人均在讨论和使用[4][5] - 区别于以往AI热潮,本次有更多C端用户感知并加入,Vibe Coding带来了最直接的成就感,让创意快速变为现实[5][12][15] AI编程对开发效率与成本的改变 - AI编程显著提升效率并降低成本,创业者公司“西羊石”的技术核心已一年多未手写代码,前端、交互、后端均用Vibe Coding搞定,月成本仅1000多元[7][8] - 大厂广泛采用AI编程,百度52%的新增代码由AI生成,目标期待是80%-90%;腾讯超过90%的工程师使用AI编程助手,50%的新增代码由AI辅助生成[11] - 市场上AI编程工具涌现,如Cursor、Kiro、Augment,以及后来的Antigravity、Claude Code、Gemeni3,国内秒哒、Coze、Qoder也承接了用户需求[9] 个人利用AI编程的实践与机遇 - 普通人利用Vibe Coding实现个人想法,例如文科背景的退休人员使用秒哒一天内做出定制化记账小程序,并用Coze、Lovart开发卡牌游戏,总成本约2099元[13] - 个人通过信息差获利,例如大三学生利用学生优惠获取AI工具账号,在闲鱼平台“共享”账号,首日收入超2000元,日均销售额3000多元,累计客户超600人[19][22] - 但通过Vibe Coding稳定月入过万仍属少数,多数人面临时间成本高、缺乏运营能力或审美不足等挑战,技术快速进化下,“品味”(Taste)成为关键过滤器[23][24][26] AI编程催生的“一人公司”模式与挑战 - Vibe Coding被认为利好“一人公司”,有成功案例显示,90后程序员独自创办的公司半年后被巨头以8000万美元收购,实现了“一人独角兽”[37] - 许多创业者使用同质化工具栈(如Claude写代码、Gemini做前端),但创业成功关键在于建立自身护城河,写代码仅是创业中最简单的一步[39][40] - “一人公司”面临运营挑战,如人手不足导致售后耗时、处理“白嫖党”退款请求等,实际运营复杂度高[40] - 部分从业者已将“一人公司”作为职业规划或现实,例如注册个人公司带领外包团队接商单,或计划在被裁员后成立公司接单做自媒体[41][42] AI编程对行业人才结构与技能的重塑 - AI降低了技术背景的重要性,如同霍格沃茨接收“麻瓜”,非技术背景者也能进入AI行业,硅谷公司雇佣的首位专业Vibe Coding师本人不会编程[33][34] - 技术背景在AI时代可能成为“负资产”,不受传统技术思维限制的非技术人员有时能更直接地实现想法,例如无视架构难度直接做出Chrome插件[34] - 培训领域出现新变化,AI破局俱乐部中的文科生一个月内能达到普通程序员水平,但创意、商业洞察和资源整合能力依然稀缺[43][45] - 原行业从业者感到被替代危机,例如品牌营销行业被认为迟早被AI取代,促使人们积极学习新技能以保持竞争力[33]
给公司全员送了iPhone 17 Pro Max,也分享下我在AI时代创业的10条感悟。
数字生命卡兹克· 2026-02-07 19:45
公司发展现状与团队文化 - 公司团队非常年轻,近三分之二(约2/3)为00后 [2] - 公司在无外部融资的情况下,团队规模已扩张至近30人,且现金流健康 [7] - 公司业务线涵盖IP、策略、Agency、MCN、活动等,支持团队包括经纪、商务、运营、视频、财法等 [7] - 公司在年会上向全员赠送iPhone 17 Pro Max,并以公司赠予方式承担相关税费 [10][11][12] - 公司鼓励尝试与试错的文化,认为在可控范围内允许犯错有助于团队成长 [85] AI时代的人才观与组织变革 - 在AI时代,好奇心比聪明更重要,好奇心强的人能力会被显著放大 [19][20] - 公司招人时越来越看重好奇心和对新事物的探索欲,而非仅关注学历和经验 [26] - 具备强大好奇心和学习能力的员工,其个人产能显著提升,例如一人可完成两三年前需三四人完成的工作 [20][21] - 不擅长人际协作但自身能力强的“超级个体”在AI时代迎来机遇,他们借助AI工具可以独立完成以往需要一个团队才能完成的任务 [34][38][40][41][42] - 公司内部存在这样的超级个体案例,例如一位视频制作人员可独立完成从脚本到后期运营的全流程 [39][40][41] - 未来的团队形态可能演变为由超级个体组成的松散联盟,协作方式和形态将发生变化 [43][44] AI时代的工作方法论与技能重塑 - 在AI时代,提出好问题的能力比提供答案更有价值 [27][28][29] - 组织最核心的产能可能在于有多少人能提出好问题,这需要基于对现实、约束和风险的深刻理解 [30][31] - 岗位的价值需要被重新定义,从执行转向判断和决策,重点在于能提出好问题并对AI输出进行专业判断 [51][53][54][55] - 公司已不再严格按传统岗位分工,更多按项目和目标组织人员,要求员工成为多面手 [57][58][59][60] - “Vibe Coding”(通过自然语言描述生成代码)降低了编程门槛,使非技术人员也能借助AI实现自动化需求,这未来可能成为像使用Excel一样的基础技能 [61][62][66][70][72][73] - 公司鼓励非技术人员学习使用此类AI工具以提升效率 [72] AI工具的应用边界与管理原则 - AI存在无法承担责任的局限性,最终责任必须由人来承担 [74][75] - 公司曾因直接使用AI生成合同和内容未加核查而引发问题,因此确立了内部原则:AI是工具而非挡箭牌,使用者必须对AI生成的内容负责 [76][77][79][80] - AI越好用,人越容易放松警惕,因此必须清楚了解AI的边界,知道哪些事情可以交给AI,哪些必须由人把关 [81][82][83][84] - 公司极度鼓励使用AI,但强调使用者必须变得专业,明确AI的边界 [84] 办公模式与绩效评估理念 - 公司坚持线下办公,认为AI时代面对面的沟通对于建立信任、情感交流、碰撞复杂想法以及形成团队凝聚力更为稀缺和重要 [85][87][89][90][91] - 公司不实行打卡考勤制度,也不以工时作为评估标准,认为在AI时代工时指标已失去意义 [94] - 公司绩效评估只看重两件事:业务结果和复用贡献(即所做工作能否被他人复用以提升整体团队效率) [94] 创业与商业模式思考 - 创业第一天就应该思考并验证商业模式,现金流是实现理想的基石 [94][97][98] - 有人愿意付费是验证产品和服务价值的关键,公司从创立之初就致力于通过多元化业务实现盈利 [95][96][97][99] - 在资本环境变化的背景下,先活下来比空谈改变世界更重要 [100][101][103][104]
又一次踩踏式崩盘。。黄仁勋、但斌发声!
新浪财经· 2026-02-05 17:43
美股AI恐慌与市场崩盘 - 市场爆发“AI恐慌”,交易员形容为“末日崩盘”,从股市到信贷市场均受冲击 [3][4] - 软件股两日暴跌15%,年内市值蒸发1万亿美元,存储芯片股出现“踩踏式崩盘” [1] - 闪迪股价下挫16%,AMD财报发布后暴跌17%,创8年最大日跌幅,恐慌情绪蔓延至亚太市场 [1] AI恐慌的导火索与核心逻辑 - 直接导火索是Anthropic推出基于Claude Cowork的AI自动化工具,其面向企业法务的插件展示出强大能力 [5] - 市场恐慌的核心在于AI开始直接接管任务,可能颠覆现有软件行业商业模式,而非仅仅“赋能软件” [5] - 新叙事变为“AI正在吞噬软件”,这动摇了SaaS公司赖以生存的“订阅模式”,导致其未来增长路径被质疑 [5][6] - 流动性猝然紧缩下,前期涨幅大、仓位拥挤的优质资产如半导体和存储芯片被优先抛售,引发崩盘 [6][7] 行业领袖与市场观点 - 英伟达CEO黄仁勋驳斥“AI将取代软件工具”的观点,称其“极不合逻辑”,并认为近期软件股抛售“毫无道理” [8][9] - 黄仁勋强调,无论是人类还是AI智能体,都会选择使用现有工具而非重新发明 [10] - 东方港湾创始人但斌的同事认为,软件板块下跌是重新定价,而非SaaS消失,因未来增量可能来自AI Agent,但传统软件公司不一定能分到蛋糕 [12] - 该观点指出,SaaS公司估值基于永续增长假设,一旦增速放缓或下滑,估值调整会非常剧烈 [12] 亚太市场反应与恒生科技指数波动 - AI恐慌蔓延至亚洲,韩股重挫3.8%,恒生科技指数早盘步入技术性熊市,但午后绝地反击,收盘上涨0.7%,终结五连阴 [12] - 恒生科技指数自2023年10月触及历史大底2720.38点后,以高波动、震荡上行方式演绎,期间已五次触及技术性熊市 [12][14] - 自2023年11月16日至2026年2月4日,该指数经历了多个涨跌周期,例如从2025年1月14日至3月7日上涨43.00%,而从2025年3月10日至4月7日则下跌21.70% [15] - 近期回调受负面传闻影响,包括某科技巨头业绩不及预期传闻、电商平台加大投入引发盈利担忧、税收调整谣言等 [16] 资金流向与ETF动态 - 尽管恒生科技指数出现五连阴,但在截至2月4日当周的前三个交易日,该指数成为“吸金”第一的指数,净流入66.73亿元人民币 [17] - 同期,恒生互联网科技业指数净流入23.5亿元人民币 [17] - 具体ETF方面,华夏恒生互联网ETF和华泰柏瑞恒生科技ETF分别净流入22.83亿元和21.09亿元人民币 [20] - 自港股去年10月高位回调以来,资金持续买入,恒生科技指数累计净流入额高达717.17亿元人民币,是最受青睐的权益指数 [24] - 同期,港股通互联网指数净流入191.39亿元人民币 [24] - 华夏恒生科技指数ETF在指数回调19%的情况下,获资金净申购156.59亿元人民币,恒生科技ETF天弘同期净流入140.54亿元人民币 [25][26] 行业比较与市场结构 - 海外AI应用市场现象级产品频出,如7×24小时AI助理OpenClaw、“氛围编程”Vibe Coding、Claude Code,对二级市场多个行业造成冲击 [16] - 相比之下,国内AI应用市场缺乏明确对标方向,年初因GEO概念火热的软件股已沉寂 [16] - 国内科技巨头将重点放在春节AI应用“红包大战”以抢夺流量入口,此举被市场认为亮点不足,甚至可能加重财务压力 [16] - 市场仍认为互联网巨头在数据、流量入口、商业生态、技术资金及场景化落地能力五大维度上,是AI应用最具爆发潜力的方向 [16]
GitHub 都没用明白,怎么用 AI 编程从零开发应用
36氪· 2026-01-24 12:26
公司产品:NEXT升级站 - 公司开发了一款名为“NEXT升级站”的鸿蒙原生应用,并于2026年1月16日通过审核上架[16] - 该应用聚焦于截图编辑与创作,核心功能包括带壳截图、快速切换设备形态、添加贴纸、调整图层顺序以及云端更新素材库[31][33][35] - 应用支持联网更新,用户无需更新应用本身即可获取最新的设备素材与贴纸[31] - 产品架构设计注重运营可控性,应用内多个环节(如机型素材、贴纸中心、创作页背景、默认壁纸、遮罩颜色和透明度)均支持通过云端配置直接修改更新[31] - 应用存在一些功能遗憾,例如未能实现“图片背景”功能,且同一素材在不同入口添加时存在显示Bug[38];此外,原计划的全局毛玻璃效果因改动风险导致布局混乱而被迫回滚[39] 开发过程与成本 - 该应用的完整开发周期约为7天,从配置环境到提交审核耗时约一周(扣除假期)[8] - 开发全链路的基础年化费用约为340.8元人民币,主要包括:腾讯云服务19.9元/月、服务器69元/年、域名33元/年[57][58] - 开发过程高度依赖AI工具(Gemini)进行从环境配置、需求评估、100%代码编写到问题修复的全流程辅助[17] - 在开发中后期,开发者需要深度介入项目管理,系统性地判断AI输出方案的可行性,并制定详细的需求指令以管控项目走向,避免AI在优化和修复时引入新问题[25][28] AI工具在开发中的应用与挑战 - AI工具(以Gemini为例)在“开新坑”阶段表现高效,能快速输出解决方案并指导完成从环境搭建到Demo运行的整个过程[19][21] - 但在“具体功能优化、Bug修复”场景下,AI工具表现出固执、短视、重复造轮子、简单问题复杂化,甚至可能擅自删除正常功能或修改数据逻辑等问题[23] - 使用AI编程面临三大挑战:1) 网络环境要求高,存在地区限制和IP污染问题,且付费订阅通常需要境外支付方式[12];2) 需要一定的技术门槛来判断AI输出方案的优劣与对错,零基础用户难以应对[13];3) 应用上架需完成备案和审核,联网应用备案流程耗时约1个月[14] - AI在图标设计环节提供了高效的工作流:生成设计稿并输出详细的Figma绘制教程,但出于图片质量、版权和后续运营拓展考虑,建议根据AI方案进行矢量重绘而非直接使用其生成的位图[40][43][45][46] 产品战略与演变 - “NEXT升级站”品牌下存在两种不同形态的产品:在微信小程序中是提供鸿蒙升级问题解决方案的工具箱;在鸿蒙原生应用中则是以带壳截图为核心的创作工具[54] - 该应用的诞生源于开发者将十年前未完成的“带壳截图”项目“秽土重生”,并结合了通过AI快速验证想法可行性的能力[53][56] - 公司认为AI最大的价值在于能够以最低成本快速验证各种天马行空想法的可行性,帮助开发者踏出关键的第一步[56]
字节跳动:“扣子”官宣2.0品牌升级,推出全新功能Agent Skills、Agent Plan
新浪财经· 2026-01-19 18:27
字节跳动AI Agent平台“扣子”2.0品牌升级 - 公司旗下AI Agent平台“扣子”宣布进行2.0品牌升级,核心是集成Agent Skill、Agent Plan、Agent Coding、Agent Office四大能力,旨在让AI成为用户的“工作伙伴” [1][3] Agent Skill(技能) - Agent Skills本质上是“场景最佳实践 + 所需工具”的封装,通过封装领域知识、标准化操作流程或集成专用工具,将通用AI认知能力与特定任务需求结合,以贴合多元化、高标准的实际应用场景,保证输出稳定性 [1][3] - 全新推出技能商店,用户可浏览、选择并一键安装由官方及优质开发者创建的专项技能模块,例如“新年绘本”、“互动教学”、“投资知识库”、“法律类案检索”等 [1][4] - 平台可根据任务场景,智能调用或组合多个已安装技能,以提供综合性解决方案 [1][4] Agent Plan(长期计划) - Agent Plan功能让AI从“即时问答工具”升级为“可持续运作的智能体”,用户只需确定目标与实现方式,平台即可持续执行、主动汇报并最终交付任务 [2][4] - 该功能实现了复杂目标的闭环管理,能将一个需要数小时、数天甚至更长时间完成的宏观目标(如“一款市场竞品分析报告”)分解为多个步骤,并持续追踪进度、管理中间状态直至交付成果 [2][4] Agent Office(办公能力) - Agent Office可深度理解职场场景,处理包括撰写战略报告Word文档、制作分析PPT、梳理Excel数据等办公任务 [2][4] Agent Coding(编程开发) - 作为一站式云端Vibe Coding开发平台,扣子编程实现了Vibe Agent、Vibe Workflow、Vibe Web、Vibe App几大核心功能开箱即用 [2][5] - 用户通过连续对话即可轻松构建智能体、工作流、网站、移动应用等,平台提供Vibe Infra基础设施,支持一键部署上线 [5] - 在该编程平台上,Agent能够自己编写提示词、安装知识库、开发工具,并能在多轮对话过程中进行自我迭代 [5]
大模型最难的AI Infra,用Vibe Coding搞定
机器之心· 2026-01-07 13:16
文章核心观点 - 传统的“氛围编程”(Vibe Coding)在应对AI基础设施(AI Infra)等复杂系统开发时,存在上下文丢失、决策偏离和质量不稳定三大痛点,根源在于缺乏持久化、结构化的决策管理机制[3][4] - 为解决上述问题,文章提出并实践了“文档驱动的氛围编程”新范式,通过系统化的设计文档将关键决策前置、结构化和持久化,使开发者专注于高层设计,AI负责实现细节,从而高效、高质量地完成复杂系统开发[5][6][7] - 该新范式在阿里巴巴团队开发的、面向Agentic RL的GPU资源调度系统(一个数万行代码的分布式训练系统)中成功应用,通过“时分复用”方案解决了GPU利用率挑战,并在生产级集群上验证了其显著性能提升[9][14][45] AI编程范式演进与挑战 - “氛围编程”(Vibe Coding)因其“聊一聊就能生成代码”的体验,在简单任务上提升了开发效率,成为开发者新宠[2] - 但在AI Infra等复杂系统(动辄数万行代码、成百上千个相互关联的决策点)开发中,传统氛围编程面临三大困境:1) 上下文丢失:对话历史被压缩,关键设计决策在多轮交互中被遗忘;2) 决策偏离:AI自主做出的技术决策容易偏离开发者意图;3) 质量不稳定:相同需求在不同时间可能得到截然不同的实现方案[3][4] - 这些问题的根源在于当前对话式编程缺乏对复杂决策进行持久化、结构化管理的机制[4] 文档驱动的氛围编程方法论 - 核心理念是将复杂系统的关键决策前置到设计阶段,通过结构化设计文档体系化、持久化地记录所有决策点,让开发有章可循,大幅降低复杂度门槛[5][6] - 设计文档作为关键工具,实现了开发者与AI在关键决策上的对齐,直接解决了传统氛围编程的三大痛点:持久化文档消除上下文丢失,明确决策避免AI偏离意图,规范和代码逻辑确保质量稳定[24] - 该方法带来了工作方式的根本转变:开发者从编码、调试等执行层面,转向与AI讨论设计、通过文档明确决策直至完全对齐,然后由AI负责实现[24] - 与传统开发和单纯氛围编程相比,文档化氛围编程在理解架构、设计方案、编码效率与质量、团队协作等方面展现出综合优势[26] 方法论实施:组织、审阅与分步开发 - **内容组织**:设计文档需系统性地跟进自顶向下的决策点,并层次化拆解,形成决策体系。文档模板需包含迭代版本记录和代码实施进度[31][32] - **审阅修改**:建立了系统化的多轮迭代审阅流程以确保文档质量。利用工具(如iFlow CLI)将常见审阅场景的指令固化为Prompt模板,以应对理解困难、修改一致性、内容爆炸、AI过度设计、逻辑错误隐蔽性等挑战[28][33][35] - **分步实施**:实施分为两个阶段:1) 规划阶段:将设计拆解为依赖有序的小步骤(通常每步包含3-5个相互关联的方法),并绘制依赖图;2) 增量开发循环:AI按步骤读取设计并生成代码,开发者审查后提交,循环直至完成[36][37][39] 防御性编程与系统健壮性 - 在分布式AI训练等复杂系统中,微小的错误可能引发级联故障,而AI编程倾向于主动进行错误处理,有时反而会掩盖真实错误信息[40] - 新范式将防御性思维前置到设计阶段:在关键节点设置验证点,构建标准化的错误处理模式库,并利用AI自动生成健壮的防御代码[40] - 具体措施包括:1) 维护统一的验证模式库(如检查整数范围、出口条件检查等),遵循单一定义、多处复用原则;2) 在设计文档中用标准化注释标注验证需求;3) AI实施时自动将标注展开为具体验证逻辑;4) 对于超过10行的复杂验证,定义独立的验证函数[41][42][44] 应用案例:Agentic RL的GPU资源调度优化 - **业务挑战**:在Agentic RL采样过程中,智能体执行任务的时间呈长尾分布,导致经典的“落后者效应”,即必须等待最慢的样本完成,造成GPU资源闲置和浪费,成为性能瓶颈[12] - **方案对比**:业界主流方案存在缺陷:1) 共置方案:rollout和training严格串行,阶段内和阶段间均存在资源闲置;2) 异步分离方案:静态分配rollout和training专用GPU,引入“双边空泡”问题,即两侧GPU都可能出现闲置[13] - **创新方案**:提出“时分复用”方案,其核心是基于rollout对GPU资源需求动态波动的洞察,设计智能资源调度机制:在采样需求低谷期分配部分GPU执行训练任务,实现需求波动与资源调度的匹配[14] - **技术实现**:采用两阶段流程:1) 全力采样阶段:所有GPU协同处理大多数样本;2) 并行执行阶段:当采样完成度达标后,系统缩容,释放固定GPU转入训练模式,同时长尾样本迁移至剩余GPU继续处理。训练完成后立即扩容,回收所有GPU准备下一轮采样[14] - **方案价值**:该策略将训练的快速执行特性与rollout需求波动在时间维度巧妙匹配,提升了整体GPU资源利用效率,但显著增加了系统复杂度[15][18] 方案性能验证与结果 - **实验配置**:在生产级大规模集群(160卡GPU)上验证,使用Qwen3-235B-A22B模型(235B参数),设置最大交互轮数100轮,最大token长度64K,batch size为512[46] - **性能对比**:与采用128卡training、32卡rollout静态分配的baseline(异步分离方案)相比,采用动态调度的时分复用方案使rollout吞吐率提升了3.5倍[47] - **任务完成率**:Baseline方案因rollout资源受限(仅32卡),采样速度慢,导致大量任务触发超时限制。时分复用方案通过动态释放更多GPU用于rollout,显著加快采样速度,完全避免了超时,提升了训练稳定性和样本利用效率[50] - **系统开销**:分析表明,时分复用方案引入的额外参数同步开销(在160卡间进行)在整体训练时间中占比极小。缩容操作(释放rollout模型参数)的实测开销在秒级,未成为性能瓶颈[53][55]