Claude Skills
搜索文档
AI应用与传媒互联网更新及标的推荐
2026-01-26 10:49
行业与公司概览 * **涉及的行业**:AI应用、传媒互联网、游戏、广告营销、漫剧、影视[1][2][3][4][5][8][11][14][28][33] * **涉及的公司**: * **AI应用与平台**:Anthropic、字节跳动(豆包、Coze)、MiniMax、阿里(千问)、元宝、OpenAI、腾讯(混元)、百度(文心一言)、夸克[1][2][4][8][24][26] * **游戏**:巨人网络、世纪华通、心动公司、凯英网络、姚记科技、三七互娱、完美世界、腾讯、哔哩哔哩[5][14][16][17][18][19][20][21][23][27] * **广告营销**:易点天下、中文互联、值得买、引力、省广[11] * **漫剧与IP**:中文在线、阅文集团、欢瑞世纪、快手(可灵)、酱油动漫[3][8][11][28][30] * **影视与娱乐**:分众传媒、猫眼娱乐、大麦娱乐、万达电影、中国电影[3][12][33][34][35] AI应用市场整体动态与趋势 * **市场行情与持续性**:2026年AI应用市场增长显著,年初行情短暂回调3-5个交易日后核心标的企稳回升,市场持续性较2025年更强[2] * **核心催化与场景拓展**:AI应用找到落地场景并拓展,从个人用户向职场人士工作流优化拓展,重塑商业叙事[1][2][8] * **国内外竞争态势**:2026年成为AI应用入口大战元年,国内豆包、千问、元宝在春节期间激烈竞争移动互联网入口[1][4] * **海外商业化加速**:OpenAI计划2026年2月启动广告变现,比预期提前一个季度,进入中后期商业化阶段,对中国市场有潜在影响[1][4][6][9] * **具体应用进展**: * **AI编程与工作流工具**:Anthropic的Claude Skills、字节跳动的Coze 2.0、MiniMax的Agent 2.0等通过模块化技能包优化工作流,提高效率与准确性[1][2][7] * **内容生成与漫剧**:抖音巨量引擎数据显示,60%的内容创作者使用AI技术生成内容,2025年第四季度AI漫剧占比超过70%[3][8] * **AI视频工具**:快手的可灵月活跃用户突破1200万,2026年1月日均收入较2025年12月增长30%[8] AI商业化进程与财务压力 * **高昂的投入成本**:OpenAI 2025年前三季度收入约43亿美元,推理支出高达86.5亿美元,并计划未来半年投入约1.4万亿美元用于数据中心建设[9] * **国内公司的成本压力**:MiniMax 2025年前三季度收入5300多万美元,推理成本达3.8亿美元,研发费用1.8亿美元[9] * **商业化变现举措**: * **广告变现**:OpenAI计划在2月初上线首批广告,挖掘9亿非订阅用户价值[9][10] * **拓展应用场景**:MiniMax推出Agent 2.0切入职场,阿里健康发布面向医生的氢离子产品,以扩大生态和提高变现潜力[10] * **技术改进带动收入**:谷歌改进Gemini对自身收入产生积极影响[10] 游戏行业具体进展与投资机会 * **AI技术融合**:AI技术正改变游戏行业,如巨人网络与巨量引擎合作探索AI结合点,优化开发流程与用户体验[1][5] * **行业突破与趋势**:2026年EVE原生情感陪伴游戏将上线,多模态或全模态融合成为重要趋势,预计使游戏制作端和原生AI玩法受益[15] * **板块交易价值**:游戏板块估值合理,各家公司对应2026年市盈率仍在20倍以内,寒假期间版本更新和商业化活动预计带来流水高峰,第一季度业绩基数较低,催化春节前后行情[14] * **重点公司动态**: * **世纪华通**:作为腾讯系核心公司,存量产品流水稳中有升,储备新品将于2026年2月或5-6月上线,受益于腾讯AI战略加速,总流水2026年有机会创新高[16] * **心动公司**:海外版小镇产品上线不到一个月全球下载量突破1000万,Discord成员数超60万,有潜力成为大DAU游戏,程序化广告业务2025年贡献近1亿利润,2026年预计继续高速增长[17] * **巨人网络**:周年庆活动后iOS畅销榜排名回到TOP 9,春节期间通过多样化变现手段、新地图及买量活动,有望迎来历史DAU和流水高峰[18] * **凯英网络**:旗下AI原生陪伴游戏EVE定档3月14日,具备Agent属性,未来可能接入阿里各类Agent,传奇盒子业务2026年增长确定性高,DAU和广告单价预估双位数提升[19] * **姚记科技**:休闲游戏主业回暖,老款捕鱼类游戏恢复稳定增长,营销业务投放消耗良好,卡牌业务受益于体育大年[20] * **三七互娱与完美世界**:受益于强供给驱动下TapTap广告收入增加,三七互娱计划加强与优质中小CP绑定,完美世界将在2月4日开启一环的第三次付费测试,流水表现是关键指标[20][21][22] * **腾讯游戏**:2026年具有较高确定性,长期游戏是业绩底盘,有5至8款重点新产品,涵盖休闲模拟经营、FPS、头部IP衍生等类型,春节期间几款拳头产品将推出重点版本[23] * **哔哩哔哩游戏**:2026年重点产品为三国百将牌(预计Q2上线)和逃离亚克夫(手游版预计年底上线),第一季度游戏业务可能稍弱,第二季度开始有望走高[27] 互联网平台与广告营销 * **腾讯AI与云进展**:通过10亿现金红包争夺AI入口流量,公有云业务有1.1万家合作伙伴并以两位数速度增长,AI相关大模型收入两年内增长超50倍,混元3D模型下载量突破300万次[24] * **快手发展情况**:可灵高频数据走高,海外收入环比2025年12月增长约60%,日均流水相比2025年仍有约两倍增长,主业估值对应2026年不到14倍市盈率[25] * **哔哩哔哩增长逻辑**:通过激励创作者制作稀缺中长视频提升DAU和时长,2025年DAU增幅8-10%,总时长双位数增长,AI应用成为重要广告客户,如千问冠名跨年晚会[25][26] * **广告营销机会**:OpenAI启动广告变现,腾讯、阿里、字节跳动等抢占流量入口,将使易点天下、中文互联、值得买、引力、省广等广告营销公司受益[11] 漫剧行业发展趋势 * **市场快速增长**:2025年底抖音平台漫剧投流日消耗突破2000万,同比增长超五倍,2026年春节期间抖音和快手单日投流预计突破4000万,同比翻倍[3][28] * **供给大幅增加**:头部公司如酱油动漫产能已达每月100至150部,与真人短剧高峰时期持平,2026年上半年行业供给还会进一步增长[28] * **平台政策支持**:抖音、腾讯视频、爱奇艺、快手、芒果TV等平台推出流量扶持、优惠分成比例及补贴政策,以抢占市场份额[29] * **重点公司布局**:中文在线、阅文集团、欢瑞世纪等积极布局,欢瑞世纪计划扩大漫剧产能至50部左右[30][32] * **阅文集团发展计划**:在AI赛道布局领先,拥有大量男频IP资源,2026年迎来游戏和影视产品大周期,将推出《一人之下》和《斗罗大陆》IP授权游戏,新丽影视将释放积压电视剧[30][31] 影视娱乐行业 * **分众传媒分红计划**:计划2024-2026年分红比例保持在扣非净利润的80%以上,21.5亿元的一次性非经常性损失不影响现金流,不会对分红产生影响[3][12][13] * **2026年春节档预期**:市场预期较弱,唯一纯喜剧《飞驰人生3》值得关注,参与方包括猫眼娱乐、大麦娱乐、万达电影等[33] * **大麦娱乐业务重点**:参投多部春节档电影,继续推广奇卡瓦IP并开展转授权业务,若政策放开韩国艺人在华演唱会,其票务平台将受益[34] * **中国电影公司展望**:春节档参与度高,进口片票房预计进一步增长,好莱坞大片将在暑期及年底上映,引进正常推进[35] 其他重要内容 * **投资方向建议**:建议关注广告营销板块(如易点天下、中文互联等)和AI漫剧板块(如快手、可灵、中文在线、阅文集团等)[11] * **心动公司TapTap业务**:2026年TapTap广告收入将显著受益于行业强供给驱动[17] * **欢瑞世纪额外收益**:受益于电视剧积压释放及审核政策变化带来的收益[32]
爆火的Skills如何给大模型加入“技能”?记者实测
贝壳财经· 2026-01-22 10:09
文章核心观点 - 一种名为“Skills”(技能)的AI新范式正在全球范围内快速普及,其核心在于将个人或组织的特定工作流程和隐性知识封装成标准化、可重复调用的模块,使通用大模型能够更精准、高效地完成具体任务,从而解决大模型“懂道理却不会干活”的痛点 [1][2] - 该范式自2025年10月由Anthropic旗下Claude首次推出后,在不到3个月内迅速获得OpenAI、微软、腾讯、字节跳动等国内外科技巨头的跟进与支持,从一个实验性功能演变为行业开放标准 [1][2][4] - “Skills”通过自然语言即可编辑和创建,降低了使用门槛,使得非技术背景的普通职场人士也能参与构建,促进了个人与组织经验的沉淀,并催生了“技能商店”等生态平台的出现 [2][3][6][8] Skills的概念与核心价值 - Skills被定义为能够将多轮提示词(prompt)及相关资源“封装”到一起的“标准化模块”,用于教会AI以可重复的方式完成具体任务,例如按照公司规范生成文档或自动化处理个人事务 [2] - 其核心价值在于解决通用大模型的痛点:大模型拥有知识,但缺乏散落在组织和个人经验中的“技能”,如特定代码框架、财务报销制度、品牌调性等,这些需要通过实践总结的隐性知识无法被模型直接调用 [2] - Skills可以将公司的规范、流程以及创造者本人的经验“沉淀”在模块中,使用时直接调取,无需重复输入提示词,实现了从“每次都得教一遍”到“学会一遍,终身受益”的转变 [8] 行业发展与巨头跟进 - 2025年10月16日,Anthropic为其AI模型Claude悄然推出Claude Skills功能 [2] - 一个月后的12月18日,Anthropic决定将Skills发布为开放标准,允许任何AI平台和开发工具实现该标准 [3] - 随后,OpenAI的ChatGPT出现了几乎一模一样的架构,微软、腾讯等旗下的编程工具也官宣支持Skills标准 [4] - 2025年1月19日,字节跳动旗下AI Agent平台“扣子”更新,上线“技能商店”,成为国内首个将Skills翻译为“技能”并推出类似功能的大厂 [1] - 截至2025年1月21日,Anthropic官方Skills库在GitHub上的星数已接近5万 [6] 功能实测与应用场景 - 实测显示,通过自然语言描述工作流程(如文章结构、标题样式)可快速生成定制化技能,例如“贝壳财经科技类文章写作技能” [6] - 生成的技能可通过输入范例文章和学习反馈进行迭代优化,从而产出更符合特定风格(如记者文风)和调性的内容 [6][7] - 技能商店中已出现多样化的应用实例,包括:创造历史课件、分析股票板块热度、创建新年绘本、自动化写作、地图数据可视化、生成AVG游戏、Markdown排版、法律类案检索等 [8][9] - 一个名为“花叔的自动化写作”的技能已有4800人安装,该技能运行迭代2个月20版以上,产出10篇以上1万+阅读文章 [8] 技术机制与行业影响 - Anthropic设计了“渐进式披露”机制以降低算力消耗:AI启动时仅扫描每个技能的元数据(约100 tokens),仅在需要执行任务时才加载完整的SKILL.md文件(约3000 tokens)和相关脚本,这使得一个智能体可以装备上百个技能而平时几乎不占用上下文 [10] - 行业形成共识,即“别造Agent(智能体)了,造Skills就行”,表明Skills被视为更具体、更可行的AI能力构建路径 [6] - Skills推动了工作流程的“原子化”,例如将信息搜集、处理和核验拆分为不同技能,未来企业的竞争力可能取决于其私有技能的数量与质量,以及将隐性知识转化为标准化模块的效率 [10]
从入门到用好 Agent Skills,看这一篇就足够了
Founder Park· 2026-01-21 13:52
Claude Skills的概念与原理 - Skills是模块化的能力扩展包,用于扩展通用Agent的功能,每个Skill打包了LLM指令、元数据和可选资源(脚本、模板等),Agent在需要时自动使用它们[22] - 可以将Skill理解为“通用Agent的扩展包”或“工作交接SOP大礼包”,它教会Agent如何完整处理特定工作,将执行方法、工具调用方式及相关知识材料封装为一个完整的“能力扩展包”[14][23] - 一个相对标准的Skill结构包括:必需的SKILL.md核心指令文件,以及可选的scripts/可执行代码、references/参考文档和assets/素材资源目录[24] Skills与MCP的区别及技术优势 - MCP是一种开放标准协议,关注AI如何以统一方式调用外部的工具、数据和服务,本身不定义任务逻辑或执行流程[18] - Skill则教会Agent如何完整处理特定工作,它将执行方法、工具调用方式以及相关知识材料封装为一个完整的“能力扩展包”,使Agent具备稳定、可复用的做事方法[18] - Skills相较于Workflow和程序编写的AI应用有三个关键优势:非技术人员可用零代码、自然语言编写;能突破预设限制,灵活响应用户输入,应对边缘情况;多个Skill可以自由联用,应用方式极其灵活[33] Skills的真实价值与潜力 - Skills的价值被大大低估,一个好Skill能发挥的智能效果,甚至能轻松等同、超越完整的AI产品,任何不懂技术的人都能开发属于自己的Skills[3][4] - 非技术出身的领域专家,离自己做专业Agent只剩隔着一层窗户纸——将专业经验和工作流程用文档形式写清楚,Agent就能照着执行[54] - Skills让更多人、组织、行业参与AI应用的创造成为可能,不必说服IT团队理解需求或等待产品迭代,自己就能创建工具并随时调整Skill的行为[163][164] Skills的核心运行机制:渐进式披露 - Skills采用“渐进式披露”机制来管理上下文长度,Skill内容被划分为三个层级:Level 1(SKILL.md元数据,始终加载,约100 tokens)、Level 2(SKILL.md正文,触发时加载,建议少于5000 tokens)和Level 3(子技能文档、代码脚本、资源等,按需动态加载)[77][79][85] - 默认只加载元数据意味着可以给一个Agent同时安装很多Skills而不影响上下文性能[82] - Level 3的代码脚本在Agent电脑(虚拟机)中直接调用,脚本代码本身不进Context Window,只有运行完成后的输出会进入Agent的Context[90] Skills对AI产品设计的影响与未来趋势 - 基于Skills的垂直Agent,在性能、开销上的问题并非不可解决的持续性问题,因为Skills能直接调用代码逻辑而不进Context窗口,Agent也可以只承担类似hook的角色,实质上和正常程序运行并无差别[101][102] - 未来AI Native产品的发展趋势可能是:内置类似Skill的指引,当用户输入时,AI快速自行判断并自动匹配各种Skills来处理,从而用同一个多模态输入框处理用户各种不同的输入,并能灵活应对边缘问题和提供绝对个性化的生成需求[103][104] - 结合token价格下降和Agent速度提升的趋势,Skills-based的Agent产品有望成为主流[102] Skills的适用场景 - 最典型的信号是:为了完成某个任务,在多轮对话中需要不断向AI解释一件事应该怎么做,此时应将规则打包成一个Skill,一次创建永久复用[141][142] - 当某些任务需要特定知识、模板、材料才能做好时,属于“通用Agent + 垂直知识”的典型场景,适合使用Skill[143][144] - 当一个任务需要多个流程协同完成时,可以将每个环节的指令文档、可执行脚本、参考材料、可用资源打包成单个或多个Skill,让Agent智能调用不同的Skill模块来完成复杂任务[146][148][149] Skills的生态现状与创业机会 - Claude Skills于2025年10月中旬正式发布,两个月后Agent Skills作为开放标准被进一步发布,意在引导一个新的AI Agent开发生态,OpenAI、Github、VS Code、Cursor均已跟进[10][11][13] - 现有Skills公开市场(如skillsmp.com/zh)尚不完善,缺少合理的分类、排序与精选体系,导致用户难以找到需要的Skills[126][129] - 对于Agent创业者及非技术领域专家,Skills代表新机会:垂直Agent工具用传统方式开发周期需数周,但用Skill方式几小时甚至几分钟就能测试起来,且智力与能力上限有机会直逼通用Agent,这极大地降低了验证想法的成本[156][157][161]
AI Agent的C端新标杆:Claude Skills:传媒
华福证券· 2026-01-14 21:00
行业投资评级 - 传媒行业评级为“强于大市”(维持评级)[8] 报告核心观点 - Anthropic推出的Claude Skills是AI Agent在C端应用的新标杆,它通过文件夹结构赋予AI Agent专业能力,并已成为跨平台可移植的开放标准[2][3] - Skills功能通过搭建个性化复杂工作流,显著扩展了Agent的可得性和潜在市场,使普通C端用户也能轻松创建或使用技能[4][5] - Skills与MCP(模型上下文协议)形成互补,共同让Agent能力更清晰,是Anthropic工程化能力和Agent成熟生态的体现[5] - 未来的大模型竞争焦点在于模型落地的盈利转化,Anthropic正利用其优势构建Agent领域的“大模型-数据-应用”飞轮[6] - 投资建议关注在AI Agent领域具有场景优势和模型优势的公司[7] 行业动态跟踪总结 - 2025年10月16日,Anthropic官网宣布推出Claude Skills功能[3] - 2025年12月18日,Anthropic将Agent Skills规范发布至agentskills.io,使其成为开放标准[3] - 微软已在VS Code和GitHub中采纳该标准,Cursor、Goose、Amp等主流编程Agent也已支持[3] - Anthropic在GitHub上的Skills仓库星标数已接近4万,社区创建和分享的skills数以万计[3] 产品能力与市场影响总结 - Claude Skills已展现出覆盖办公、设计、开发、企业协作等场景的强大能力[4] - 文档处理方面,Skills可自动生成带公式的Excel、创建格式规范的PPT、编辑Word、填写PDF表单等[4] - 设计协作方面,Skills可调用Canva、Figma等外部工具,直接使用品牌素材生成设计稿,支持从需求文档自动生成UI原型[4] - Anthropic提供了多种官方工作流Skills,如Atlassian Skills可将产品规格书一键转化为Jira任务看板、自动生成Confluence状态报告;Notion Skills实现从提问到执行的无缝衔接;Stripe Skills处理支付对账;Zapier Skills串联多系统自动化流程[4] - Skills允许非技术人员以零代码方式将专业经验转化,通过自然语言定义并分享专属工作流,支持MCP调用和Skills间互相调用,以开发复杂多流程任务[5] 公司发展战略与行业趋势总结 - Anthropic正在复制MCP的成功路径:先在自家产品打磨成熟,再开放为行业标准,最终构建生态护城河[5] - 大模型的应用效果对于用户场景和付费点的发掘、特定行业生态的链接、用户使用感受、产品价值发现等方面有更多要求[6] - Anthropic不仅提供高质量代码大模型,还利用积累的大模型优势、丰富的用户使用数据和愈加丰富的应用合作生态,逐渐形成Agent领域的“大模型-数据-应用”飞轮[6] 投资建议总结 - 建议关注AI Agent具有场景优势和模型优势的公司:腾讯、阿里巴巴[7]
AI Agent的C端新标杆:Claude Skills
华福证券· 2026-01-14 19:50
报告行业投资评级 - 行业评级为“强于大市” [7] 报告的核心观点 - Anthropic推出的Claude Skills是AI Agent在C端应用的新标杆 通过开放标准构建生态 显著扩展了Agent的可得性和应用潜力 [2][3] - Claude Skills通过文件夹结构赋予AI Agent专业能力 能搭建覆盖办公、设计、开发、企业协作等场景的个性化复杂工作流 [3][4] - Skills与MCP(模型上下文协议)形成互补 共同提升Agent能力 MCP负责连接外部工具 Skills负责组合成有意义的工作流程 [6] - 大模型竞争焦点转向落地与盈利转化 Anthropic凭借“大模型-数据-应用”飞轮 正在构建Agent领域的生态护城河 [6] - 投资建议关注在AI Agent领域具有场景优势和模型优势的公司 [7] 根据相关目录分别进行总结 一、Anthropic再发Agent新开放标准:Claude Skills - 2025年10月16日 Anthropic推出Claude Skills功能 是一种通过文件夹结构赋予AI Agent专业能力的创新方式 [3] - 2025年12月18日 Anthropic将Agent Skills规范发布至agentskills.io 使其成为跨平台可移植的开放标准 [3] - 微软已在VS Code和GitHub中采纳该标准 Cursor、Goose、Amp等主流编程Agent也已支持 [3] - Anthropic在GitHub上的Skills仓库星标数已接近4万 社区创建和分享的skills数以万计 [3] 二、Skills搭建个性化复杂工作流,让Agent真正可得 - 产品层面 Claude Skills已展现出覆盖办公、设计、开发、企业协作等场景的强大能力 [4] - 文档处理方面 Skills可自动生成带公式的Excel、创建格式规范的PPT、编辑Word、填写PDF表单等 [4] - 设计协作方面 调用外部工具如Canva、Figma等生成的Skills 可直接调用品牌素材生成设计稿 支持从需求文档自动生成UI原型 [4] - Anthropic提供了多种官方工作流Skills 如Atlassian Skills可将产品规格书一键转化为Jira任务看板、自动生成Confluence状态报告 Notion Skills实现从提问到执行的无缝衔接 Stripe Skills处理支付对账 Zapier Skills串联多系统自动化流程 [4] - Skills扩展了Agent的可得性和潜在市场 普通C端用户也能轻松创建或使用技能 [5] - Skills允许非技术人员以零代码方式将专业经验转化 通过自然语言定义并分享专属工作流 还支持MCP在流程中的调用、Skills之间互相调用 最终开发针对不同场景的复杂多流程任务 [5] 三、从Skills看Agent的未来发展 - Skills功能是Anthropic Claude自身工程化能力和Agent成熟生态的体现 [6] - Anthropic正在复制MCP的成功路径 先在自家产品打磨成熟 再开放为行业标准 最终构建生态护城河 [6] - 未来的大模型竞争越来越关注模型落地的盈利转化 在新赛道上 大模型的应用效果对于用户场景和付费点的发掘、特定行业生态的链接、用户使用的感受、产品的价值发现等方面有更多要求 [6] - Anthropic不仅局限于提供高质量代码大模型 还利用积累的大模型优势 丰富的用户使用数据和愈加丰富的应用合作生态 逐渐形成Agent领域的“大模型-数据-应用”飞轮 [6] 投资建议 - 建议关注AI Agent具有场景优势和模型优势的公司 腾讯、阿里巴巴 [7]
Skills vs MCP,谁才是「大模型的 HTTP 时刻」?
机器之心· 2025-12-06 10:30
文章核心观点 - 文章探讨了Anthropic推出的MCP协议在发布一年后的发展现状、社区争议及其与Claude Skills的关系,核心在于分析MCP协议的真实定位、适用边界及其作为基础设施的潜在价值,而非简单地将Skills视为MCP的替代品[1][7][12] builder 比 user 还多,MCP 仅是「旧瓶装新酒」? - 自发布一年以来,MCP的定位、适用场景和未来发展在业内存在持续争议[4] - 从技术栈看,MCP被定义为“client和server之间的通信协议 + 统一工具访问方式”,而非“AI USB”、Function Calling升级版或万能Agent框架[4] - 支持者视MCP为“大模型的HTTP时刻”,是AI下一阶段掌握工具能力的基础[4] - 反对者认为MCP是“旧瓶装新酒”,沿用了传统的服务注册和路由方法,仅将工具调用协议化,更“AI化”的做法应是将工具描述嵌入向量空间进行一步到位的匹配[4] - 另有观点认为Function Calling已规范工具调用,MCP只是将其转为显式协议,在当前生态下更像过渡方案[4] - MCP生态呈现“builder多于user”的现象,有科技博主称“MCP is probably the only piece of tech that has more builders than users”,该言论浏览量超28万[4] - 社区数据显示,已上线超过6000个MCP服务器,活跃开发者2000-3000人,终端用户约50000-75000人,平均25个用户对应1个开发者[5] - 服务器关注度分布不均,排名前10的服务器吸引了近一半用户关注,前10%的服务器获得了88%的星标[5] - 目前除少数面向开发者的IDE支持MCP外,主流网页端AI应用并不直接提供MCP接入,普通用户难以感知和使用[5] - MCP在实际使用中存在调用效率较低、资源消耗高和运行不够稳定等问题,企业发现直接通过系统API访问比通过MCP协议调用更便捷,因此MCP生态更多停留在开发者技术实验和内部验证阶段[5] - 社区认为MCP目前更适用于B端的“Data Open + 工具复用”场景,例如:需要向第三方开放扩展的平台、需跨多端复用同一套工具并进行版本管理、以及内部工具链尚未标准化时使用MCP SDK来统一流程[5][6][7] - 对于小型内部项目或一次性集成需求,使用MCP会增加不必要的复杂度;对于性能敏感的应用,MCP协议层的抽象和基于JSON-RPC的通信格式可能成为效率瓶颈[7] Not Skills vs MCP, but Skills with MCP? - Anthropic推出Claude Skills后,社区引发了关于Skills和MCP定位与分工的讨论[7] - 分析认为Skills更关注“如何做”,即业务流程和策略层面;MCP则回到具体“执行层”,主要负责调用后端工具[8] - Skills相当于“带知识的可移植工具调用+子代理”,封装了领域知识和业务逻辑;MCP则是远程调用运行在服务器上工具的机制[8] - 有用户认为Skills更像是“更省context的MCP,用来获取how-to指令”,许多MCP Server内部也会为工具编写说明性文档,作用类似Skills[9] - 在组织上,一个Skill通常由YAML头部、Skills.md文档和可选的资源文件组成,主要说明和资源文件仅在实际调用时加载,以有效节约token[9] - 举例:可为个人助手创建“会议管理”和“会议准备”等Skills,而访问邮箱、日历、Notion等外部系统的操作仍通过MCP Server完成[9] - 有观点认为Skills发布目的就是替代MCP,因为当两者功能重叠时,开发者更倾向于使用更友好的Skills;而MCP能实现但Skills不能的(如通过API实现动态更新功能)目前作用不大[10] - MCP的创新在于将模型与工具间的M×N次适配问题简化为M+N问题,但主要缺点是开发者需编写大量代码实现每个MCP Server,集成成本高[10] - 相比之下,Skills允许开发者用自然语言在SKILL.md中描述工具、资源和提示词,对开发者更友好[11] - Skills可以在提示中直接为LLM提供业务流程指导和思路,而MCP本身只是被动暴露工具接口,无法主动控制LLM的思维方式[12] - 从实用角度,对普通开发者和用户而言,“拿来即用的Skills市场”比“自己写MCP server”更有吸引力,标准化和共享的Skills可降低使用门槛[13] - MCP工具描述往往非常耗费token,例如官方的GitHub MCP接入需消耗上万token,部分团队通过让LLM直接调用CLI工具等轻量方法来替代部分MCP流程以提高效率[13] - 也有人认为现状是“Not Skills vs MCP, but Skills with MCP”,即Skills负责封装和组织业务流程、调用顺序,MCP则继续发挥接入数据和工具的作用[12] 过去一年,围绕 MCP 的 infra 层格局逐渐清晰? - 有分析指出,MCP的大规模落地可能还需等待下一个类似“微信小程序”的入口出现[3]
从《塞尔达传说》理解 Agent 的上下文工程:Claude Skills 还是被低估了
Founder Park· 2025-11-18 15:59
Claude Skills的核心设计哲学 - Claude Skills是一种AI Agent能力扩展机制,通过将指令、脚本和资源组织成标准化技能包,让通用Agent转化为特定任务专家[4][8] - 其关键创新在于信息分层设计哲学,借鉴了3D游戏的细节分层(LOD)和按需加载技术,使Agent能够像人类一样先看索引、再看摘要、最后按需查原文[5][9] - 这种设计可节省高达95%的Token消耗,同时显著提升决策质量和响应速度[6][9] 信息分层架构的具体实现 - 采用三层架构:LOD-0摘要层(名称和描述,约20-50 tokens)、LOD-1核心层(完整功能说明,约1-3k tokens)、LOD-2原始层(完整原始信息,按需加载)[29][31][32] - 每层对应不同的加载时机和用途:LOD-0在启动时预加载构建全局认知,LOD-1在判断相关后按需加载支持核心工作,LOD-2在处理复杂场景时精确查询[31][36][44] - 架构深度耦合查询工具系统,LOD-0到LOD-1使用文件读取工具,LOD-1到LOD-2使用具备过滤能力的工具如SQL和grep[47][48][50] 实战应用效果 - 在企业数据分析场景中,传统方法消耗约150,000 tokens,而三层架构仅需约5,000 tokens,节省96.7%[60] - 响应时间从45秒缩短至5秒,提升9倍效率,调用成本降低30倍[60] - 通过预计算高质量摘要实现"计算换Token"策略,用一次性廉价计算资源换取每次调用的Token节省[56] 架构优势与挑战 - 优势在于处理大型复杂信息体时避免Agent"信息溺水",特别适合必须通过过滤、查询或聚合才能有效使用的场景[43][45] - 挑战包括高质量LOD-1摘要的构建成本需要专业工程师投入,以及信息同步的维护成本防止"信息漂移"[63][64] - 设计复杂度较高,需要系统性思考信息组织与查询工具的耦合,避免对简单信息过度分层[65] 通用设计原则 - 核心原则是用元信息替代完整信息,绝大多数决策初期只需元信息或摘要信息而非原始信息[67] - 按需加载而非预加载,只在明确需要时通过工具精确获取最少必要信息[71][72] - 架构具有分形特性,可递归嵌套应用于不同层级的信息系统管理[79][82]
OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客
晚点LatePost· 2025-10-20 11:51
行业动态与巨头布局 - 2024年10月,OpenAI、Google、Anthropic三家主要模型公司均在Agent开发工具上推出新动作:OpenAI推出AgentKit,Google发布Gemini CLI Extensions,Anthropic推出Claude Skills [6] - Agent工具链已成为硅谷创业热点,LangChain融资1亿美元成为独角兽,ElevenLabs员工老股交易估值达66亿美元,OpenAI以11亿美元全股收购Statsig [7][24] - 过往全球开发者工具市场规模约200-300亿美元,AI可能将该市场规模推高十倍 [9] OpenAI AgentKit产品解析 - AgentKit涵盖Agent构建、部署和维护全周期,包括可视化构建工具Agent Builder、前端部署工具ChatKit以及评估优化工具New Evals [12] - Agent Builder通过拖拽式工作流构建Agent,思路与追求高度自动化的AGI终局路径相反,但更易于在企业中安全落地 [13] - ChatGPT周活跃用户达8亿,为开发者提供巨大分发红利和信任背书,有助于应用冷启动和进入大型企业采购流程 [15] - OpenAI不会放弃to B市场,其用户规模、生态竞争压力及B端数据对模型提升的重要性都支撑其持续投入企业侧 [17] Agent工具链的六次进化 - 第一次进化在2022年底ChatGPT发布后,催生LangChain等框架以管理外部数据和复杂任务编排 [26] - 第二次进化在2023年6月OpenAI官方支持function calling,以及2024年11月Anthropic发布MCP协议促进工具复用 [26] - 第三次进化在2024年5月GPT-4o推出高质量语音模式,带火实时音视频基础设施如LiveKit [27] - 第四次进化由Claude 3.5 Sonnet增强编码能力推动,产生对安全代码执行沙盒环境的需求 [27] - 第五次进化在2024年9月OpenAI发布o1 preview提升推理能力,催生强化学习微调和评估监督工具 [27] - 第六次进化是2024年10月Computer Use和Browser Use能力出现,形成完整的浏览器操作生态 [28] 关键创业方向与公司案例 - Composio作为MCP协议集成商,提供数百个高质量MCP Server,其产品Rube能根据任务自动调用正确的MCP Server [30][31] - Composio通过AI Agent自动生成和优化MCP Server代码,形成数据闭环和自进化壁垒 [34][35] - LiveKit作为实时音视频基础设施,日通话量从一年前的100万次增长至2000万次,年增20倍,服务OpenAI、Salesforce等大客户 [38][39] - 语音交互存在两种范式:级联式(语音→文本→模型→文本→语音)和端到端语音到语音,后者被认为是终局但前者在当前更可控 [40] - 记忆方案公司Letta提出"睡眠时计算"概念,为Agent提供情境、流程、知识和角色四类记忆管理 [42][43] 市场规模与投资逻辑 - AI可能将全球软件市场规模从6500亿美元推高至约10万亿美元,服务于AI Agent的工具链市场规模可能达到2000-5000亿美元 [50][51] - 百亿美元级公司的出现需具备成为行业标准、形成自进化数据闭环、卡住关键工作流节点三个维度 [53] - 具体机会领域包括智能体身份与调度(如Composio)、Agent可观测性(如Braintrust)、实时通信(如LiveKit)以及工作流集成 [52]
Gen AI for Business #79: The Diwali Edition
Medium· 2025-10-20 02:58
核心观点 - 生成式人工智能正在重塑行业、基础设施和未来工作,本周新闻涵盖了从OpenAI定制芯片、谷歌医疗突破到新治理法律和不断上升的电力成本等多个方面,展示了技术的光明面与阴影面[1] 模型发展 - 微软发布首个内部开发的文本到图像模型MAI-Image-1,声称通过创意专业人士的反馈减少了“通用”风格,生成速度比大型模型更快,在LMArena基准测试中位列前十[7] - xAI加入开发“世界模型”的竞赛,该系统通过视频/机器人数据训练,以理解物理丰富的环境,用于游戏和机器人技术,计划最早于2026年发布AI生成游戏[6] - 谷歌Gemma模型帮助发现新的潜在癌症治疗途径,系统分析了数百万分子相互作用,发现结合CK2抑制剂和低剂量干扰素可增强难以治疗肿瘤的免疫识别[11] - Anthropic发布新旗舰模型Claude Sonnet 4.5,在SWE-bench Verified上达到最先进水平,在OSWorld真实世界计算机任务上达到61.4%,声称能在复杂任务上保持专注超过30小时[15] - Anthropic推出“Claude Skills”系统,允许开发者为Claude模型构建定制能力,将其转变为模块化代理框架[15] 平台与工具更新 - 微软为Windows 11推出新AI功能,深化Copilot集成,包括唤醒词“Hey Copilot”、将Copilot Vision扩展到所有市场,以及实验性“Copilot Actions”模式,允许助手从桌面执行现实世界任务[7] - 谷歌迭代AI Studio,进行UI更新和开发者中心更新,包括Gemini/GenMedia/TTS/Live的整合Playground、新主页、实时速率限制仪表板,以及Gemini 2.5 Flash Image的“构建模式”[11] - 谷歌推出Veo 3.1和Flow的高级功能,Veo 3.1专注于现实主义、叙事控制和更严格的提示遵循,Flow扩展了编辑工具集,包括更丰富的音频集成和修改照明、阴影的控制[11] - 谷歌Meet悄悄推出“AI驱动虚拟化妆”功能,与美宝莲和欧莱雅等美容品牌合作,实时调整照明、色调和纹理[11] - 谷歌照片推出语音驱动编辑功能,用户只需描述想要的更改即可编辑图像,支持语音输入和键入提示[35] 芯片与硬件 - NVIDIA宣布DGX Spark开始发货,这款“世界上最小的AI超级计算机”在紧凑桌面单元中提供高达1 PFLOP性能,具有128 GB统一CPU-GPU一致性内存,基于Grace Blackwell (GB10)和NVLink-C2C构建[16] - Oracle确认其下一波云AI产品将由Nvidia Blackwell GPU提供支持,将捆绑优化的CUDA、TensorRT和企业微服务用于模型部署[16] - Oracle和AMD扩大合作伙伴关系,从2026年第三季度开始,OCI将提供由50,000个AMD Instinct MI450 GPU初始驱动的公开可用AI超级集群,2027年进一步扩展[16] - 微软倡导具有本地推理和辅助工作流程的“AI PC”,而苹果发布旨在设备上AI加速的M5芯片,M5提升至10核CPU和10核GPU,添加与GPU管道绑定的神经加速,声称AI任务峰值GPU性能比M4高4倍[20] 合作伙伴关系与投资 - OpenAI与Broadcom建立10千兆瓦合作伙伴关系,旨在超越竞争对手[4] - OpenAI与沃尔玛建立合作伙伴关系,让用户通过一句话购物[4] - Meta和Arm扩大合作,将Arm的Neoverse与Meta的排名/推荐引擎配对,目标是在Meta基础设施中实现性能每瓦增益[10] - NVIDIA、微软、xAI和BlackRock参与收购Aligned Data Centers的交易,价值约400亿美元,Aligned运营约50个园区,管理近5吉瓦容量,财团计划注入300亿美元初始股权,并通过债务融资扩展至1000亿美元[28] - 阿里巴巴重申3800亿元(约530亿美元)的三年AI/云支出,并继续扩展基础设施,如本周宣布的第二个迪拜数据中心[24] 行业应用与案例 - 近一半(47%)美国银行决策者表示其机构在2025年已全面推出生成式AI,高于2023年的10%,三分之二的高管同比增加AI支出[31] - MIT技术评论报道AI设计病毒已出现并正在杀死细菌,Arc研究所/斯坦福大学研究人员报告首个AI生成、实验室可行的噬菌体基因组,设计了16种感染大肠杆菌的新噬菌体[32] - BMC医学综述调查大型语言模型如何进入临床试验堆栈:方案起草、资格解析、患者匹配、招募消息、站点可行性和不良事件编码[32] - Adobe推出AI代理,包括Audience Agent寻找购买群体角色、Journey Agent协调活动和Data Insights Agent呈现趋势,旨在保护品牌声音[20] 监管与政策 - 美国政府在出口管制豁免下批准Nvidia向阿联酋经审查的项目销售先进AI芯片,该决定涵盖低于最严格性能级别的选定配置[21] - 美联储理事克里斯托弗·沃勒警告AI可能“放大金融市场波动”,如果模型驱动类似羊群的算法行为,敦促银行在交易和贷款中部署生成模型前嵌入风险控制[21] - 加州成为美国首个监管AI伴侣聊天机器人的州,要求披露非人类身份、验证用户年龄并包括心理健康支持触发器,该法律于2026年1月生效,对违规行为引入严厉处罚[22] 研究与趋势 - Gartner的新供应链战略炒作周期将生成式AI置于幻灭低谷期,许多试点项目难以生产化,而供应链网络安全处于膨胀预期峰值[26] - 搜索引擎土地比较不同AI引擎如ChatGPT、Gemini、Claude、DeepSeek和Perplexity的检索策略、实时网络使用和引用行为,强调生成引擎优化(GEO)的重要性[36] - 论文《通过早期经验的代理学习》提出模仿学习和强化学习之间的“中间地带”:在代理自身早期交互上训练,无需显式奖励信号,在八个环境中评估报告有效性和域外泛化能力提升[36] 风险与挑战 - ScienceDirect论文发现将仅250个恶意或“中毒”文档注入模型微调语料库可显著偏置其输出,改变安全过滤器或泄露秘密,实验使用Llama 3和Mistral等开放模型,显示即使标准防御下也存在漏洞[13] - 好莱坞与AI斗争加深,OpenAI和工作室在版权和同意上冲突,Sora-2允许用户将真实人物和著名角色放入AI视频,引发工作室、机构和家庭的快速反弹[27] - 分析显示电价上涨集中在大型数据中心建设附近地区,AI加速电力需求增长,Bloomberg 9月29日交互文档记录热点和本地价格峰值,DOE估计2028年数据中心需求升至美国电力约6.7-12%(2023年约4.4%)[28] - OpenAI的Sora视频模型尚未公开,但数百个“Sora”仿冒应用出现在苹果App Store,在开始下架前积累数千下载,一些应用仍通过苹果过滤器,使用近乎相同的名称、图标和描述[29]
“Claude Skills很棒,可能比 MCP 更重要”
36氪· 2025-10-17 15:56
Anthropic发布Claude Skills新功能模式 - 公司推出Claude Skills新模式,使模型能够获取新功能[1] - Skills是包含SKILLmd文件的目录,包含指令、脚本和资源,用于为代理提供附加功能[3] - 全新文档生成功能完全通过Skill实现,涵盖pdf、docx、xlsx和pptx文件格式[3] Skills技术实现与成本效益 - 会话开始时,Claude工具扫描所有可用Skill文件,从Markdown文件前置YAML读取简短说明[3] - 实现方式具有极高成本效益,每Skills仅占用几十个额外token[3] - 只有在用户请求该Skill协助解决任务时才需要加载完整详情[3] Skills实际应用案例 - slack-gif-creator skill示例用于创建专为Slack优化的GIF动图,包含尺寸约束验证器和可组合动画元件[4] - 使用slack-gif-creator skill生成GIF时,Claude会检查文件大小确保不超过2 MB限制[8] - 如果文件尺寸太大,模型会尝试进一步缩小[8] Skills与编码环境依赖 - Skills机制依赖于模型能够访问文件系统、具备导航工具以及执行命令的能力[9] - 这种向本地机器扩展的模式在Cursor、Claude Code、Codex CLI和Gemini CLI等编码智能体工具中得到应用[9] - Skills需要为模型提供安全的编码环境,考虑将运行环境沙箱化以限制潜在攻击[9] Skills与MCP协议对比 - Skills相比MCP协议具有显著优势,避免对token的大量消耗[14] - MCP的GitHub官方实现消耗巨量上下文token,影响模型实际作用空间[14] - Skills允许用Markdown文件描述任务,在需要确保可靠性或效率时引入额外脚本[14] Skills的设计优势与生态前景 - Skills设计简洁,仅包含Markdown文本、少量YAML元数据和可选脚本[17] - Skills易于共享,预计将有大量Skills以单文件形式实现,复杂Skills采用文件夹形式包含更多文件[15] - Skills可与其他模型配合使用,如Codex CLI或Gemini CLI,即使工具本身不具备系统性skill知识也能正常起效[15] Skills的潜在应用场景 - 可构建"数据新闻智能体",处理获取人口普查数据、分析结构、发布数据等任务[13][19] - 可使用Python库将不同格式数据加载进SQLite或DuckDB,在线发布为S3存储桶内的Parquet格式文件[19] - 可由数据报告skill从新数据中发现故事,另一Skill使用D3构建数据可视化结论[19]