Workflow
Skill
icon
搜索文档
GEO已死,AEO是答案
虎嗅APP· 2026-03-16 22:17
文章核心观点 - 互联网底层逻辑正经历从SEO(搜索引擎优化)、GEO(生成式引擎优化)到AEO(智能体引擎优化)的第二次突变,AEO时代正在拉开序幕[7] - 未来的互联网将是“Agent协同网络”,商业逻辑从“争夺眼球”和“话语权”转向“分发能力”和“执行权”,服务需被智能体“雇佣”而非仅被“搜索到”[9][12][13] - 拥抱AEO并打造符合其准则的Skill(技能包),是通往下一代互联网的入场券[27] 从“争夺眼球”到“分发能力”的范式转移 - 互联网默认受众正从人转向智能体(Agent),商业铁律从追求点击率、留存时长转向提高服务被智能体发现、理解、激活并正确执行的概率[9] - SEO优化“眼球”,GEO优化“语料”,而AEO优化的是“动作”,产品需成为一个随时待命的“原子化能力包”[10] 为什么GEO面临着“降维打击”? - GEO被视为传统搜索时代的最后一次回光返照,在智能体互联网中局限性暴露,它争夺话语权,而AEO争夺执行权[12] - 用户指令从寻求信息(“知道”)转向要求执行(“做到”),未来商业价值始于服务能“被雇佣”而非仅“被搜索到”[12][13] Moltbook启示录 - Moltbook作为智能体社交平台,展示了Agent-to-Agent社交网络的巨大潜力,人类退居幕后成为指令下达者,智能体成为主角[15] - 这将带来两大颠覆性改变:流量入口从浏览器收敛为个人私人Agent;商业转化漏斗从“官网”转移到“Agent的任务规划流”[18] 做AEO的基本准则是什么? - 需遵循三大基本准则:应对昂贵的“上下文租金”,提供高语义密度内容以节省Agent算力与注意力;解决颗粒度错配,为Agent提供确定性逻辑、严格参数Schema和闭环反馈;解决安全性难题,GEO滥用可能导致数据投毒和误导信息[17] - 具体实施需注重:意图映射,声明在特定场景下调用服务是唯一最佳选择;确定性描述,为API定义严苛清晰的语义说明;设计反馈闭环,在调用报错时返回强引导性提示词以教导Agent[19] - 在AEO时代,API的语义描述就是“品牌文案”,接口的确定性就是“客户口碑”[20] AEO时代的最佳着眼点是Skill - Skill(而非API或MCP)成为AEO时代的标准载体,因其“渐进式加载”机制能极大节省上下文成本,仅在任务匹配时动态下载完整执行代码[22][23] - 一个顶级的Skill需具备四大特质:自带SOP封装,交付像数字员工般的完整操作经验;设定“反向提示词”,明确告知调用边界以增加信任评分;具备“自愈能力”,通过柔性反馈机制让Agent自我纠偏;实现原子化与跨平台互通,遵循开放标准一处编写全网运行[24]
Agent 热潮年度回望:一切火爆早有预兆
36氪· 2026-02-09 16:00
文章核心观点 文章系统回顾了2024年至2025年期间,推动智能体(Agent)从概念热潮走向工业化落地的关键变量。核心观点认为,行业正经历从宏大叙事向务实架构的转变,焦点从追求“像人”的自治转向构建“可长期、稳定、可治理”的系统[30]。这一过程通过协议建设、架构分层、技能网络化、记忆系统完善以及开源模型发展等多个层面的收敛与演进共同实现[4][6][9][18][22][26]。 关键变量总结 01 行业认知的收敛与转向 - Agent经历了从“元年”的宏大叙事(如多智能体社会、AI员工、数字组织结构重构)向应对现实工程挑战的转变[4] - 早期Agent存在执行链条不稳定(“五步不过冈”)、长任务易偏航、权限模糊、成本不可预测等问题,难以融入严肃工作流[3][4] - 行业心态从询问“它像不像个员工?”转向关注“它能不能长期、稳定、可治理地做事?”[30] 02 底层协议的建设与挑战 - 行业出现了为Agent时代建立统一底层协议的系统性尝试,以MCP和A2A为代表[6] - MCP旨在为模型接入工具和数据建立统一接口,A2A则希望实现Agent之间的跨平台协作,常被类比为Agent时代的TCP/IP[7] - 协议建设面临挑战:工具体系复杂多样,商业边界与权限约束各异,且标准版本、厂商立场和实现不一致,导致推广谨慎[7] 03 架构分层:从“认知+执行”到技能(Skill)重构 - Agent形态演变为“认知+执行”的组合体,架构上分为认知层、技能层、连接层和持续层[10] - **认知层**:由大语言模型负责,承担理解意图、拆解任务和规划决策,接受其不确定性[10] - **技能层**:将涉及外部后果的动作(如发邮件、改数据、下单)封装为可复用、可治理的执行单元(Skill),确保输入输出清晰、权限明确、可重试、可审计[10][17] - **连接层**:负责将技能连接到外部世界(如数据库、SaaS系统)[10] - **持续层**:负责管理任务状态与长期记忆,保障连续性[10] - 与API的区别在于控制权迁移:API时代组合逻辑由程序员写在代码中,Skill架构下组合逻辑由模型在运行时规划,实现了从“程序员写流程”到“模型生成流程”的转变[15][17] 04 技能(Skill)密度与网络效应 - 当模型能力进入同一量级后,竞争焦点从“谁更聪明”转向“谁背后站着更多真实可用的技能”[19] - 技能价值呈网络化增长:技能模块化后,新增一个技能不仅增加一种用途,更创造出多种组合可能,技能密度越高,系统的“解题维度”越多[19] - 生态发展的关键不再是技能数量,而是技能的流动性,即能否被检索、被不同模型规划、跨系统复用,从而形成网络效应[20] - 当前Agent生态类似移动互联网早期,尚未出现大规模第三方能力市场、稳定的技能商店或形成网络效应的爆款应用[21] 05 记忆(Memory)系统与任务持续性 - 记忆是保障任务连续性的关键,使Agent从一次性推理工具转变为持续存在的系统[22] - 记忆系统包含三层结构:**任务状态**(实现断点续跑)、**长期语境**(存储用户偏好、组织约束等)、**行为轨迹与决策历史**(积累行动模式)[24] - 长上下文、RAG与持久记忆是不同概念:长上下文扩展单次推理的注意力范围;RAG解决外部信息检索;持久记忆则实现跨时间、跨任务的背景继承与经验积累[23] - 记忆系统使Agent具备组织价值,但其发展仍面临成本、更新与遗忘机制不成熟,以及错误或偏见被固化的风险[25] 06 开源大模型的角色与影响 - 中国开源大模型(如千问、Kimi、Step)在过去一年取得显著跃迁,频繁进入开发者的真实工作流[26] - 以阶跃星辰的Step 3.5 Flash模型为例,其采用稀疏混合专家结构,总参数1960亿,每次激活约110亿参数,注重效率与结构[26] - 开源模型的技术改进(如混合注意力机制、多token并行预测)恰好对应了Agent时代对更长上下文、更低延迟、更稳定逻辑执行的核心需求[27] - 本地部署能力(如256K上下文模型可在128GB内存的MacBook上运行)改变了权力结构,实现了“终端平权”,并满足了医疗、金融等垂直行业对可控、可部署基座的需求[29]
闭门探讨:130位AI创业者,对Clawdbot和下一代AI产品的39条思考
Founder Park· 2026-02-05 20:52
文章核心观点 Clawdbot(现称OpenClaw)作为现象级的开源Agent操作系统,其核心突破在于赋予了AI高度的自主权限和开放式的Skill创造能力,推动了AI从被动响应工具向主动服务、自我迭代的执行工具演进[4][5] 该产品将IM(即时通讯)入口、个人AI云电脑和Skills(技能)分别类比为新的操作系统、运行环境和应用程序,预示着一个以Skill为核心、AI与AI高效互动(A2A)的新应用生态和商业模式正在形成[7][11] 然而,该技术目前在大规模落地前仍面临安全机制不足、基础设施不完善以及成本过高等关键挑战[18][19][20] 从被动响应到主动服务,AI开始自己迭代自己了 - Agent产品当前面临用户“任务定义能力”不足的挑战,导致交互体验笨拙[4] - Clawdbot的最大突破在于实现了“自主权限的突破”,允许AI在开放、无边界的环境中编辑和创造Skill,为自我进化打开了空间[4] - 产品通过内置机制(如默认每4小时自动探索任务)赋予Agent更多自主性,催生了更多可玩性和想象力[4] - AI展现出强大的自主感知能力,能够主动感知用户本地文件、邮箱、日历等环境变化,并据此创造和调度执行新的Skill[4] - Clawdbot最核心且“可怕”的一点是AI能够迭代工具本身,并已成为无可争议的开源Agent OS第一名[5] - 个人本地Agent被认为是实现Agent自我进化(self-evolve)的最佳场景,因其任务多样化且需持续记忆用户偏好[5] - Clawdbot的进化速度超乎想象,已快到让从业者感到“吓人”的程度[5] Skills就是新时代的Apps - 未来生态中,Agent与IM是新的OS,个人AI云电脑是新的Runtime,而Skills就是新时代的Apps,这将催生大量创业机会[7] - 用户交互入口发生根本变化:从主动打开产品转变为在数百亿流量的IM入口中通过Skill与产品交互[7] - 底层基础设施(沙箱、云电脑、大模型)将趋于同质化成为标配,Skills提供的增量价值成为唯一变量[7] - 自2026年开始,新变量出现:开发者可能不再需要构建自己的交互入口,而是开发Skill并发布到Skill Store,等待被大量Agent发现和调用[7] - 商业化模式转变:产品价值取决于用户在IM中激活并运行Skill所带来的收益,关键是为每一次成功的Skill执行付费,而非订阅整个App[8] - Skill将成为所有平台的标准,未来竞争将围绕Skill Store的SEO、Skill交互链路优化及商业化闭环设计展开[8] - 绝大多数产品将“Skill化”,开发者只需提供能力并优化被发现、调用及交互的机制,无需维护传统UI界面[8] Memory as a File System - Agent的Memory(记忆)与Self-evolving(自我进化)紧密相关,是Agent进化的基础[9] - “Memory as a File System”是未来方向之一,因为Agent擅长读取上下文,以文件形式记录信息对其更友好[10] - 未来的记忆系统将是混合解决方案,Agent需能自主判断任务需要精确检索、模糊检索还是检索结构化索引[10] - 进化需要反馈闭环,当前Clawdbot的迭代仍需人工反馈进行引导,未来需将用户反馈做成Memory,让Skill在其中迭代进化[10] - Clawdbot的本地文件系统存在Token消耗大、召回能力有限(因缺乏索引)的问题,未来需依赖云端、由小模型驱动的记忆引擎进行推理、信息凝练、召回和过滤,形成多智能体协作系统[10] 人类「交互带宽」有限,终极形态应该是A2A互动 - AI产品难破圈的原因在于传统C端用户的日常任务和信息处理“带宽”有限,复杂任务易导致用户“认知带宽”溢出[11] - 人类“交互带宽”同样受限,点对点信息传递在微信等应用已到极限,人脑处理速度无法支持高效的“面到面”大规模沟通[11] - Clawdbot的兴奋点在于实现了AI与AI(A2A)互动的可能,Agent之间能以机器速度完成成千上万次高效“握手”,极大提升社会信息交流效率[11] - 在“AI与AI互动”的基础上,社交、内容社区等大量应用可以被重新构建[12] - 从AI底层能力看,人类通过Chat指挥LLM的范式是错误的,未能发挥AI在“速度”上的优势,2026年可能才是AI带来真正冲击的“狼来了”时刻[13] 未来的AI产品,应该「活」在用户最高频的工作流中 - AI入口发生剧变:从ChatGPT等周活10亿的“目的地”应用,扩展到所有IM及聊天入口,潜在覆盖用户达百亿甚至千亿级别,实现了最自然直接的交互[14] - IM即任务入口:通过集成滴答清单等应用的Skill,用户可在IM聊天框中让AI拆解任务、管理日程,使IM成为任务管理入口,GUI仅作为汇总看板[14] - 社交场景:Clawdbot的执行能力与社交结合,可能催生全新社交平台,例如帮助用户寻找同好,甚至通过与其他人的Agent交流形成新社交圈层,提升信息处理效率并拓宽视野[15] - 交易场景:Clawdbot结合预测市场(如Polymarket)被广泛用于搭建交易Bot,降低了专业交易门槛,相关教程在推特和GitHub上大量涌现[15] 端侧可以作为,Agent上下文的「沉淀池」 - 从端侧产品角度看,核心仍是Agent本身的设计,包括模型和脚手架的优化[16] - 端侧设备(手机、穿戴设备)可作为Agent上下文的“沉淀池”,因其与用户交互最直接频繁,沉淀了大量真实、细碎且高度个性化的上下文信息[17] 安全,是目前最大的短板 - Clawdbot当前存在两大痛点[18] - 无论是云端还是本地,现有的沙箱和本地虚拟化基础设施严重不足,无法很好支持Agent的检查点和恢复等高级功能[19] - 安全是当前最大短板,产品应部署在云端并严格限制网络访问,因其目前极不安全,容易被黑客攻击[19] - 当前产品缺乏良好的备份和沙箱机制,对普通用户而言,Agent出错(如误删文件)的频率会更高[19] Clawdbot,会成为2026年AI应用的主流形态吗? - 面临两大技术挑战:一是未经优化的上下文处理导致Token消耗非常夸张,成本难以覆盖;二是低效的文件检索,因缺乏有效索引机制[20] - Clawdbot的本质是为用户配备了一台“云电脑”,使AI从信息工具转变为可执行增、删、改、查文件的执行工具,带来了与聊天不同的“增量”价值[21] - 当前爆火更像是硅谷极客圈的内部狂欢,大众市场仍然缺席,大量AI应用尚未触达更广泛、多元、下沉的市场[21] - Clawdbot类似当年的Linux,是在不设限环境中由发烧友创造的产品,其打破规则的特点打开了创新的“潘多拉魔盒”[21] - 未来很可能稳定成为一个开源操作系统,并已开始构建生态,其基于AI的进化速度(用户有疯狂想法可几分钟内由AI写成代码并发布为Skill)是传统软件开发模式无法比拟的,后来者追赶难度大[21]
这可能是今年门槛最低的黑客松比赛,速来!
Founder Park· 2026-01-26 12:07
Skill概念的市场热度与生态发展 - 2026年初,Skill概念的热度持续攀升,并迅速超越Agent、MCP等概念,成为各家产品争相支持的功能[2] - 在过去的十几天里,Skill生态正在以数倍的速度持续扩张[2] - Skill主张将专家的工作标准作业程序打包成可复用的资源包,其特点是搭建不难、易于分享且能交付结果[3] - 创建Skill不需要编码或拖拽搭建工作流,只需有一套可复用的标准作业程序,门槛比Vibe Coding还低,旨在让人人都能成为创作者[3] 行业主要参与者的战略动向 - 扣子2.0率先跟进Skill功能,并快速推出「技能商店」[4] - Founder Park联合扣子举办了Skill招募大赛,旨在促进最佳标准作业程序实践的分享,让能力成为一种流动的交换资源[5] - 大赛的核心倡导是将可标准化的执行工作交给Skill,使人的能力和时间能聚焦于决策和创造[6] Skill招募大赛的赛题设置 - 大赛设置职场和极客两个赛道,参与者可选择单个或多个赛题进行Skill开发[6] - **职场赛道**征集能将日常工作方法论、专业领域知识、复杂性流程封装转化为可复用能力的实用性Skill,旨在助力职场人提效减负[7] - **工作效率提升方向**:针对述职汇报、会议协作、项目跟进等高频办公场景,将个人沉淀的标准作业程序转化为技能,例如自动整理会议纪要并输出行动项、项目进度自动同步提醒等[9] - **市场营销创作方向**:面向内容创作者与营销从业者,打造具备强交付能力的营销类技能,覆盖从内容策划到素材投放的全流程场景[10] - **金融专业分析方向**:面向金融从业者,打造满足一致性规范、可审计、强决策支撑核心需求的技能,如财报关键指标速读、行业动态跟踪等[11] - **极客赛道**聚焦视觉冲击力、技术门槛与代码能力、交互体验的魔法感,面向开发者征集具备技术突破性与体验创新性的Skill[12] - **强视觉冲击特效方向**:鼓励打造高质量视觉特效能力,包括酷炫粒子效果、沉浸式3D空间场景,以及玻璃拟态、流体流动等创意光影表现[13] - **可视化库封装与应用方向**:征集可作为Skill能力模块独立调用的可视化方案,如动态智能图表、交互式地图等组件封装[14] - **代码创意交互方向**:倡导基于编程语言实现具有创意表达的交互型技能,例如网页动画生成、新颖的手势交互逻辑,或结合陀螺仪、摄像头等硬件能力的联动效果[15] 赛事激励机制与开发者支持 - 入选的优质Skill将公布至扣子技能商店页面[17] - 提供流量扶持,为优秀Skill加码商店内曝光资源,助力技能触达更广泛用户群体[17] - 对符合条件的优质Skill开放付费权限,开发者可依托技能售卖实现创作变现[18] - 提供额外的社区福利:极客赛道入选Skill可获得500元京东礼品卡,职场赛道入选Skill可获得300元京东礼品卡,名额共计10份,按报名顺序发放[19] - 提供扣子周边作为奖励,福利名额有限,按报名顺序依次发放[19] 高质量Skill的定义与构建标准 - 一个快速判断Skill是否成立的方法是:其方法论在固定输入条件下,能稳定产出可直接使用的结果,且在该场景下的效果与确定性明显优于通用大模型工具[25] - 高质量Skill的核心标准是具备专业领域知识,非通用Agent能完成,本质上应像一个高度专业的虚拟员工,能独立、可靠地完成一项完整、有价值的任务[26]