Skills
搜索文档
2026 中国企业 AI 应用场景报告:千份实践解码 AI 价值落地全路径 | 极客时间企业版
AI前线· 2026-04-01 15:26
报告概述与核心目标 - 报告旨在破解AI应用落地困局,通过梳理近千份成功案例,为企业从“规模化验证”迈向“价值化落地”提供全景式指引 [2] - AI正从实验室走向产业深水区,成为企业降本增效、创新增长的关键引擎,但面临应用停留在工具层面、落地效果不及预期、行业场景适配难等痛点 [2] - 报告涵盖金融、零售、能源、制造等多个重点行业,拆解成功案例背后的底层逻辑 [2] 核心技术趋势洞察 - 多模态模型技术演变:从扩散与自回归混合架构,到原生全模态模型加速成型,再到世界模型技术路线的首轮收敛,实现从“效果涌现”到“价值涌现”的关键跃迁 [4] - 2025年多模态技术迎来突破性发展,扩散、自回归及混合架构路线成熟,字节Mogao/Bagel、腾讯TokLIP等模型落地 [10] - 2026年原生多模态将成为AI标配,原生全模态模型加速落地,世界模型技术路线首轮收敛为具身智能和自动驾驶奠定基础 [10] - 超级智能体成为核心:AI从被动Chatbot升级为能动的超级智能体,多Agent协同形成“数据→模型→决策→反馈”闭环,成为产业落地的真正执行层 [4][10] - 71.4%的企业已搭建智能体平台,75.3%的企业有明确的Token消耗量感知 [11] 行业标杆案例与量化成果 - 报告精选金融、零售、能源、制造四大重点行业标杆案例,聚焦效率提升、风险管控、精准决策、全链路协同、合规保障五大高成功率场景 [5][11] - 金融行业:债券交易链路从4-6小时压缩至分钟级,人效提升10倍;单店200小时视频审计在8小时内完成,识别置信度达98% [12] - 零售行业:核心场景包括价格监控、反舞弊审计、客流分析 [12] - 能源行业:燃气客服接通率从8.7%提升至93%,年节省人工成本2000万元;运维效率提升31.2%,年增发电收益8.35亿元 [13][14][16] - 制造行业:核心场景包括工艺优化、质量检测、研发创新 [15] 企业AI成功落地五大共性规律 - **场景适配**:筛选“痛点刚需、数据可及、价值可量化”的高成功率场景 [6] - **技术框架**:搭建以智能体为核心的四层认知闭环(感知-规划-执行-反思) [6] - **工程化体系**:通过模块化设计、可复用中间层降低重复开发成本 [6] - **数据融合**:打通多模态数据中结构化与非结构化的壁垒,构建“数据-模型-反馈”的持续迭代闭环 [6] - **合规安全**:实现本地部署与数据隐私保护,适配监管要求 [6] 前沿工具与技术选型参考 - 报告详解Skills、DeepSeek、OpenClaw等前沿工具如何降低AI应用门槛与Token消耗 [4] - **Skills**:作为本地优先的开源框架,具有低门槛部署优势,全链路规避数据泄露风险,重构人机交互入口 [16] - **DeepSeek**:实现知识与推理解耦,大幅降低推理成本,帮助企业实现知识内嵌融合 [17] - 选对工具的核心价值在于让AI落地更高效、更经济、更安全 [17]
Claude Cowork 负责人:别再给 AI 配工具了,给它一台电脑
Founder Park· 2026-03-20 20:11
文章核心观点 Claude Cowork 是 Anthropic 公司推出的一个本地 AI Agent 产品,它通过为 Claude 模型提供一个虚拟机环境,使其能够像真人一样访问和操作本地计算机资源,从而极大地扩展了 AI 在知识工作自动化方面的能力,其新功能 Dispatch 进一步实现了通过手机远程指挥电脑端 Agent 工作[1][2][4][5] Claude Cowork 的产品定位与本质 - Claude Cowork 本质上是运行在虚拟机中的 Claude Code 的用户友好版本,旨在让非技术人员也能使用强大的 Agent 能力[8] - 产品负责人认为,用户友好并非简化,而是一个“超级集合”,其易于扩展和融入工作流程的特性类似于 Visual Studio Code 的成功路径[9] - 该产品源于公司内部的原型文化,并非从零开始,而是在众多现有组件(如 Claude Code)基础上快速组合而成,开发周期仅10天[10] 产品核心功能与设计理念 - **虚拟机 (VM) 是核心**:为 Claude 提供一个安全隔离的完整 Linux 电脑环境,使其能自由安装软件(如 Python、Node.js)并执行任务,而非局限于问答框[5][16][17] - **设计理念是拟人化**:将 AI 视为人类同事,赋予其访问用户所有相同工具的权限,认为将其置于用户工作的地方是最有效的方式[17][19][21] - **Skills(技能)系统**:允许用户将自动化工作流程打包成可复用的技能,其优势在于极易创作且可高度个性化,一条短信即可成为一个技能[24][26] 行业趋势与产品策略洞察 - **执行成本降低,平台价值上升**:当 AI 使得执行(如写代码)成本趋近于零时,拥有可组合的现成平台基础设施的价值反而增加[12][14] - **反对过度专业化**:公司认为高度专业化、针对特定技术栈的 AI 应用在短期内可能有效,但一旦模型泛化能力增强,其生命周期可能不会太长[27][30] - **投资抽象层级**:类似于 Electron 框架,在具有最大杠杆效应的抽象层级进行投资,是为未来做准备的最佳方式[28] - **模型迭代优先于过度优化**:公司倾向于不过度投资于针对当前模型弱点的“脚手架”修正,而是等待下一代更强大的模型发布[29][30] 安全与评估方法 - **采用分层防护的“瑞士奶酪模型”**:不追求构建完美系统或等待100%的模型对齐,而是依靠多层防护组合来保障安全[32] - **评估侧重点不同**:Claude Code 主要针对编码任务进行优化评估,而 Claude Cowork 则针对典型知识工作(如金融、法律办公)进行评估[22] 未来发展方向 - **继续深耕本地计算机**:未来方向是继续加倍投入,让 Claude 在用户的本地电脑上变得更有效[36] - **探索多人协作模式**:正在探索让 Agent 像人类一样使用现有工具(如拥有独立的 Slack、Gmail 账号)进行交互和协作的可能性[37][38] - **Remote 功能即将到来**:将支持更长时间的任务独立运行,并且远程指挥功能(Dispatch)已上线,未来可能进一步扩展[2][35][39]
搞不懂Skills?看看Claude Code内部工程师们是怎么玩的
机器之心· 2026-03-20 13:21
文章核心观点 - Anthropic公司内部已在Claude Code中广泛使用Skills,目前有数百个Skills在实际运行中,它们是使用最广泛的扩展方式之一[5] - Skills不仅仅是Markdown文件,而是一个可以包含脚本、资源、数据的文件夹,为智能体提供发现、探索和操作的能力[8] - 文章旨在分享从内部实战中总结的关于Skills制作、使用、推广和分发的经验,而非权威指南,鼓励通过实践进行探索[3][4][6][75] Skills的类型与示例 - **库与API参考**:解释如何正确使用库、CLI或SDK,包含参考代码片段和常见问题避免方法[13] - **产品验证**:描述如何测试或验证代码是否正常工作,常与外部工具配合使用,对确保Claude输出正确非常有用[14][15] - **数据抓取与分析**:连接到数据和监控系统,包含通过凭证抓取数据的库以及常见工作流说明[17] - **业务流程与团队自动化**:将重复工作流自动化,可能有复杂依赖关系,将先前结果保存在日志文件中有助于保持模型一致性[18][19] - **代码脚手架与模板**:用于生成代码库中特定功能的框架模板,在自然语言要求无法仅通过代码覆盖时尤为有用[20] - **代码质量与审核**:强制执行组织中的代码质量并帮助审查代码,可包含确定性脚本或工具以确保稳健性[21] - **CI/CD与部署**:帮助在代码库内获取、推送和部署代码,可能引用其他Skills以收集数据[22] - **运行手册**:通过症状进行多工具调查,并生成结构化报告[26] - **基础设施操作**:执行常规的维护和操作程序,涉及需要有防护措施的破坏性操作,使工程师更容易遵循最佳实践[27] 制作Skills的技巧 - **不要陈述显而易见的内容**:Claude Code已了解很多默认知识,Skills应专注于能让Claude脱离正常思维方式的信息[32] - **构建陷阱(Gotchas)部分**:这是Skills中最有价值的部分,应基于Claude使用Skills时遇到的常见失败点构建,并随时间更新以保持有效性和准确性[35][37] - **利用文件系统和渐进式披露**:将整个文件系统视为上下文工程的方式,通过指向其他Markdown文件、在assets文件夹中包含模板文件等方式,帮助Claude更有效地工作[40][41][42][43] - **避免过度束缚Claude**:给予必要信息的同时保留灵活性,以适应不同情况,避免指令过于具体[44] - **思考Skills的设置**:对于需要用户上下文的Skills,可将设置信息存储在config.json文件中,或指示Claude使用AskUserQuestion工具呈现结构化多选问题[47][48][49] - **优化描述字段**:描述字段是给模型的,用于描述何时触发Skills的场景,是Claude决定是否有Skills能解决请求的依据[52] - **实现记忆与存储数据**:可通过在内部存储数据实现记忆功能,如使用文本日志文件、JSON文件或SQLite数据库,但需注意数据应存储在稳定文件夹中[55][56] - **存储脚本与生成代码**:提供脚本和库是给Claude最强大的工具之一,可让其专注于组合和决策,而非重建基础代码[57][58][59] - **使用按需钩子(On Demand Hooks)**:可包括仅在Skills被调用时激活的钩子,作用持续到会话结束,对于有强烈意见但不希望一直运行的功能特别有用[61][62] Skills的分发与管理 - **分享方式**:有两种方式分享Skills,一是将Skills检查到代码库中,二是创建插件并拥有Claude Code Plugin市场供用户上传和安装插件[64][65][67] - **管理市场**:Anthropic内部没有一个集中式团队决定哪些Skills进入市场,而是通过自然方式找到最有用的Skills,例如上传至GitHub沙箱文件夹并通过Slack分享,获得关注度后可提交PR移入市场[68][69] - **组合Skills**:Skills可以相互依赖,目前市场或Skills中没有内建依赖管理功能,但可以直接通过名称引用其他已安装的Skills[71] - **衡量效果**:使用PreToolUse钩子记录公司内Skills的使用情况,以发现哪些Skills受欢迎,哪些触发率低于预期[72][73]
Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。
数字生命卡兹克· 2026-03-11 10:07
Anthropic Skill-creator工具的重大更新 - Anthropic官方推出的Skills生成器Skill-creator迎来了“史诗级”更新,新增了四项核心能力,显著提升了Skills的创建、评估与优化效率[8] - 此次更新补全了Skills开发生态中至关重要的“评估机制”,解决了旧版工具生成Skills后质量难以量化评估的痛点[13][15] - 更新方式极其简便,用户只需向Agent发送包含GitHub仓库链接的指令即可自动完成更新[16][17] 新增的四大核心功能 - **评估系统**:在Skill生成后,系统能直接评估该Skill的可用性与质量,为开发者提供明确的改进方向[10][14] - **基准测试**:将Skills的通过率、任务耗时、Token消耗量等关键指标进行量化,提供客观的性能数据[11] - **多代理并行测试**:支持在完全独立、干净的环境中运行多个测试代理,支持A/B盲评,避免了上下文污染导致的结果偏差,使测试数据更干净、结果更可靠[12][58] - **描述调优**:能够自动优化Skill的描述文本,精准调整触发条件,确保该触发时触发,不该触发时不误触发[13] 功能演示:以视频讲稿生成Skill为例 - 使用新版Skill-creator,通过自然语言描述需求(如“给定视频链接,生成文字讲稿,非中文视频需提供中英双语文档”),工具可在3-5分钟内自动生成对应的Skill[23][24][25] - 生成的Skill可处理来自YouTube、B站等平台的视频链接,并输出格式规整的`.docx`文档[27][30][31] - 当存在多个触发条件相似的Skills(如下载视频与生成讲稿)时,可利用工具的评估体系来优化Skill描述,防止触发冲突[32] 描述调优与触发率提升的具体流程 - 工具会**自动生成两组共20条查询样本**(10条应触发,10条不应触发),其中包含大量边界案例,以测试Skill描述的鲁棒性[34] - 通过一个交互式网页界面,开发者可以逐条确认样本的触发判断是否正确,并可手动调整,最终导出“评估集”[35][37][38] - 随后,系统会启动最多5轮的迭代优化循环,整个过程约需10-20分钟[39] - 优化过程采用**60%训练集和40%测试集**的划分,在训练集上迭代优化描述,最终根据在测试集上的表现选择最优版本,有效防止过拟合[43] - 优化完成后,最优的Skill描述会自动写回`SKILL.md`文件,全程无需手动操作[44] - Anthropic官方在6个文档类Skill上测试,其中**5个的触发率得到了提升**[44] 全面的技能评估与基准测试 - 评估系统能自动读取Skill文件,理解其核心流程,并据此设计覆盖不同场景的测试用例(如英文视频、中文视频、对话视频)[48][49][50] - 支持**多代理并行测试**,例如同时启动4个独立子代理在不同环境下运行测试,大幅缩短评估时间并确保结果纯净[55][57][58] - 测试完成后,系统会提供详细的评估查看页面,包含输出预览和量化基准测试结果[60][61][63] - 基准测试会对比“有Skill”与“无Skill”基线的表现,量化展示通过率、耗时和Token消耗的差异[64][65] - 在案例中,优化后的视频讲稿生成Skill通过率达到**100%**,而无Skill基线的通过率仅为**9%**,差值达**91.5个百分点**;有Skill时每次任务消耗约**4000个Token**,比无Skill基线多消耗约**2250个Token**[65][66] 评估驱动的迭代改进闭环 - 评估过程能发现Skill在实际应用中的具体问题,例如官方PDF Skill曾存在的表格内容定位不准问题,正是通过评估发现并得以修复[69][70][71][72] - 所有的评估结果和用户反馈会**本地保存**,当再次使用Skill-creator改进该Skill时,历史问题会被直接引入,实现有针对性的迭代优化[75] - 这形成了一个完整的“测试-发现-修复-再测试”的改进循环,将软件工程中严谨的测试与迭代实践引入了Skills开发流程[77][78] Skills生态的战略意义与分类 - Skills被视为Agent(如Claude)未来生态繁荣的基石,其数量和质量直接决定了Agent的能力边界[80] - Skills主要分为两类:**能力提升型**(教模型做其原本不擅长的事)和**编码偏好型**(规定模型按特定流程或规范执行任务)[82][83][86] - 对于能力提升型Skill,评估重点是A/B测试对比其与基线模型的性能差异,若效果相近则意味着该Skill可能已无存在必要[94] - 对于编码偏好型Skill,评估重点在于检验模型是否严格遵循了预设的工作流和格式要求,有无遗漏或擅自更改步骤[88] - 此次Skill-creator的更新,通过引入标准化、数据化的评估体系,有望推动整个Skills生态迎来新一轮的繁荣发展[92][93]
Skills推荐与实战应用:量化看市场系列之六:OpenClaw金融行业必备
华创证券· 2026-03-09 18:44
量化模型与构建方式 1. **模型名称:条件选股模型**[48] * **模型构建思路**:基于给定的财务指标(总市值、市盈率)对A股全市场股票进行筛选,构建符合条件的投资组合,并进行历史回测[48]。 * **模型具体构建过程**: 1. 从数据库(如Wind)获取全部A股的最新数据[48]。 2. 设定筛选条件:总市值小于500亿元,市盈率(TTM)大于0且小于300倍[48]。 3. 对满足筛选条件的股票,构建等权重投资组合[48]。 4. 以筛选日(例如2026-03-06)为起点,回测该等权组合在过去10个交易日的收益率表现[48]。 2. **模型名称:形态学量化策略(黄包车夫形态)**[52] * **模型构建思路**:基于特定的K线形态(黄包车夫形态)识别交易信号,以形态出现后的第二天开盘价作为买入价,统计不同持有期后的收益情况,以验证该形态的有效性[52]。 * **模型具体构建过程**: 1. 从数据库获取目标股票(如寒武纪,688256.SH)的全部历史日K线数据[52]。 2. 定义并识别“黄包车夫”(Rickshaw Man)K线形态。该形态需满足以下条件[52]: * 实体极小:$$ \frac{|收盘价 - 开盘价|}{开盘价} < 0.58 $$ * 上下影线都较长:上影线长度 > 实体长度 × 2,且下影线长度 > 实体长度 × 2。 * 上下影线接近:$$ 0.5 \leq \frac{上影线长度}{下影线长度} \leq 2.0 $$ * 当日有足够振幅:$$ \frac{最高价 - 最低价}{最低价} > 2\% $$ 3. 每当识别到该形态,即以形态出现日的下一个交易日的开盘价作为模拟买入价[52]。 4. 分别计算买入后持有1天、3天、5天、8天、10天、20天的收益率[52]。 5. 对所有识别到的形态进行统计,计算各持有期的平均收益率、胜率、最大收益和最小收益[52]。 3. **模型名称:指数仿制策略(南华综合指数模拟)**[53] * **模型构建思路**:通过筛选A股中与大宗商品相关的股票,并按照南华综合指数的品类权重分配板块及个股权重,构建一个股票组合来模拟南华综合指数的走势[53]。 * **模型具体构建过程**: 1. **确定选股范围**:根据申万行业分类,筛选出与大宗商品相关的A股,涵盖煤炭、石油、有色金属、钢铁、化工、农产品加工等行业,共得到397只股票[53]。 2. **设定板块权重**:参照南华综合指数的构成,为不同板块分配目标权重。例如:能源30%、工业金属25%、黑色系20%、贵金属10%、化工10%、农产品5%[53]。 3. **构建组合**:在每个板块内部,按照成分股的流通市值进行加权,计算各股票在板块内的权重。再将板块权重分配到板块内各股票,得到股票在模拟组合中的最终权重[53]。 4. **回测与评估**:在回测区间(例如2025-03-06至2026-03-06)内,计算模拟组合的净值曲线,并评估其相对于基准(南华综合指数)的表现,计算各项绩效指标[53]。 模型的回测效果 1. **条件选股模型**[48] * 选股日期:2026-03-06 * 筛选结果:共筛选出3,197只符合条件的A股[48] * (注:报告未提供该等权组合在过去10个交易日的具体收益率数值)[48] 2. **形态学量化策略(黄包车夫形态)**[52] * 测试标的:寒武纪 (688256.SH) * 数据区间:2020-07-20 至 2026-03-06 (共1364个交易日) * 形态出现次数:65次 * 各持有期表现统计[52]: | 持有天数 | 平均收益率 | 胜率 | 最大收益率 | 最小收益率 | |:--------:|:----------:|:------:|:----------:|:----------:| | 1日 | +1.45% | 53.85% | +17.81% | -7.21% | | 3日 | +3.21% | 58.46% | +32.40% | -11.08% | | 5日 | +3.88% | 55.38% | +45.74% | -18.47% | | 8日 | +5.00% | 55.38% | +67.10% | -20.13% | | 10日 | +4.81% | 49.23% | +85.35% | -23.64% | | 20日 | +6.10% | 36.92% | +150.28% | -25.84% | 3. **指数仿制策略(南华综合指数模拟)**[53] * 回测区间:2025-03-06 至 2026-03-06 (共243个交易日) * 累计收益率:+61.79%[53] * 年化收益率:+64.70%[53] * 年化波动率:19.11%[53] * 夏普比率:3.281[53] * 最大回撤:-10.37%[53] * 前五大持仓:中国石油(11.59%)、中国神华(5.48%)、宝钢股份(4.47%)、中国石化(3.13%)、紫金矿业(2.71%)[53] 量化因子与构建方式 (注:本篇研报核心内容在于介绍AI工具(Skills)的安装使用和在金融场景下的应用案例,并展示了利用这些工具构建和回测量化策略的过程。报告本身并未独立提出或详细定义新的量化因子。所涉及的选股条件(如市值、市盈率)和形态识别(黄包车夫形态)是作为策略模型的组成部分进行应用的,并非报告重点阐述的独立因子构建方法。[48][52])
从 Clawdbot 到 26 年 AI Coding 主题大爆发|42章经
42章经· 2026-02-13 21:04
AI Coding与Agent能力跃迁 - AI Coding能力已跨越奇点,人类介入比例从过去的10%降至约0.1%,系统可自主运转[5][8] - 对AI Coding能力评分:25年初不及格,后提升至60分(小局部工作),再到80分(大模块架构与组织),目标90分(复杂项目设计与审查)[9][10][11] - 在10万行代码以内的项目中,AI的表现优于高级工程师团队,且速度更快[12] - 个人重度使用案例显示,每日消耗近十亿级别Token,产出数万行代码,相当于数十人月工作量[12] - 部分公司内部代码已100%由AI编写,未来软件开发可能呈现两极分化:100%人类手写或100%AI生成[13][14][16] 关键产品与技术演进 - **Claude Code**:定义了本轮Agent的形态基础,标志着大模型能够操控现实世界,从编程切入因其可控性,未来通用Agent形态很可能就是编程Agent[16] - **长上下文信息召回率**:关键指标从GPT-5.1的约30%提升至GPT-5.2的近90%,这对Agent在多轮复杂任务中的准确性至关重要[17] - **Agent的Context Engineering**:在System Prompt和Tool Use编排上的最佳实践由Claude Code引领并快速传播[17] - **Cowork**:本质是Claude Code的插件,封装了Computer Use能力,底层逻辑无重大突破[18][19][20] - **Skills**:优于MCP的封装方案,因其组合性更强(自然语言可叠加)、更易上手(可直接让Coding Agent现场编写)[25][26][27][29][30] - **Clawdbot**:运行在本地电脑的全能助手,能以自然语言交互,控制鼠标键盘完成几乎所有操作,底层是类似Claude Code的编程Agent[31][32][33][34] - Clawdbot被猜想为未来操作系统的雏形:内核是聪明的编程Agent,上层是Skills,最外层是交互界面[34] - Clawdbot设计包含记忆系统,可长期积累和成长,并能通过编程自我补强能力,实现一定程度的自我演化[41][42][46][47] - **moltbook**:一个AI社区,Clawdbot等AI可接入并互相交流技巧、改进工作流,展现了多智能体协作与能力涌现的潜力[47] 市场影响与未来趋势 - AI Coding能力的成熟使得直接套用AI Coding和Agent的壳成为新趋势,而非简单套用大模型[34] - 技术平权仍处早期,Clawdbot等高门槛产品的意义在于展现新的可能性,预计未来将有更多团队推出易用产品,让更多人体验[48] - 2026年AI应用层预计将迎来大爆发,AI Coding带来的体验升级将快速扩展到设计等其他领域[49][61] - 全球算力出现短缺,叙事重回堆算力,因AI Coding、多模态应用等对Token的消耗远高于早期Chatbot[59][60][62] - 未来创业方向可能集中于两个极端:追求极致“人味”(解决AI无法替代的人际连接与长尾需求)和追求极致效率(用AI将效率提升数个数量级)[52][53][54][55] - 介于“极致人味”与“极致AI”之间的业务将越来越难做[56] 组织形态与人才需求演变 - 未来组织可能由独立模块构成,每个模块由一位高级工程师负责,带领一群Agents工作,核心能力是判断与决策[67] - 模块与Agents之间协作需求降低,因单元效率极高,协作易引入问题,清晰的边界和共同目标变得更为重要[67][74][75] - 对工程师的建议是思考如何成为更有趣的人,因为编程将日益工具化,想法和创造力变得更为重要[64][65] - 编程可能分化为不同赛道:用AI满足刚需、满足竞技/艺术/审美需求、以及创造本身带来成就感的Builders[66][67] 基础设施与概念创新 - **Box概念**:作为Skills的延展或组合基础设施,将技能与完整的执行环境绑定,隔离副作用,使原子能力可被稳定、重复调用和组合[68][70][71][72] - Box的实践案例包括封装登录、下单等固定流程,为Agent提供稳定的执行空间[71] - AI当前的主要瓶颈从技术能力转向经济学问题,即算力成本与使用ROI的权衡[50][51] - AI已能覆盖所有在电脑上完成的任务,但物理世界任务(如取外卖)仍是局限[49]
计算机行业点评:Clawdbot演进,Agent时代将近
申万宏源证券· 2026-01-27 21:29
行业投资评级与核心观点 - 报告对计算机行业给予“看好”评级 [1] Clawdbot与Agent演进的核心观点 - Clawdbot标志着AI产品形态从“场景级助手”迈向“系统级Agent平台”,其核心功能涵盖目标理解、任务拆解、多系统协同操作、过程反馈与自我修正等关键模块,使Agent从“在某个软件中协助人类”升级为“能够接收目标并交付结果的执行主体”,应用边界显著扩展 [3] - 从技术与产品逻辑看,Skills、Claude Excel与Clawdbot构成了一条清晰的Agent演进路径:Skills解决“模型如何行动”的基础技术问题,Claude Excel回答“模型在特定业务场景是否具备可用性”的产品问题,Clawdbot则尝试解决“模型能否承接完整任务系统”的平台问题 [3] - 市场关注点正从模型参数规模与基础推理能力,转向模型是否能够稳定调用外部工具、拆解复杂任务并完成真实业务流程 [3] - Clawdbot的革命性体现在突破了“目标驱动”范式,它尝试理解用户的高层意图并自主拆解为一系列有序的操作步骤,这种跨工具、跨系统的协同执行能力为复杂工作流的自动化提供了全新解决方案,是AI从“辅助性生产力”迈向“准自主生产力”的重要一步 [3] - Agent的加速落地不意味着传统软件被取代,而是作为智能执行中枢提升整体效率,更现实的产业趋势是Agent成为软件的智能交互与自动化中枢,而传统SaaS与软件系统继续承担底层业务逻辑与数据基础设施的角色,Agent更像是软件价值的放大器 [3] - 随着Agent在企业运营、客户服务、数据分析、内容生产与流程自动化等领域逐步兑现效率红利,AI应用层公司有望从“技术叙事”迈入“收入与效率驱动”的新阶段,具备显著的中长期成长空间 [3] AI应用重点公司估值 - 报告列举了16家AI应用重点公司的估值数据,包括总市值及2024年至2027年的归母净利润预测与市盈率(PE)估值 [4] - **金山办公 (688111.SH)**:总市值1,635亿元,2024A归母净利润16.5亿元,2027E预测为28.0亿元;2024A市盈率99倍,2027E预测市盈率58倍 [4] - **用友网络 (600588.SH)**:总市值533亿元,2024A归母净利润-20.6亿元,2027E预测为6.6亿元;2026E预测市盈率256倍,2027E预测为81倍 [4] - **中控技术 (688777.SH)**:总市值674亿元,2024A归母净利润11.2亿元,2027E预测为15.3亿元;2024A市盈率60倍,2027E预测为44倍 [4] - **金蝶国际 (0268.HK)**:总市值440亿元,2024A归母净利润-1.4亿元,2027E预测为6.8亿元;2025E预测市盈率360倍,2027E预测为64倍 [4] - **合合信息 (688615.SH)**:总市值423亿元,2024A归母净利润4.0亿元,2027E预测为7.3亿元;2024A市盈率106倍,2027E预测为58倍 [4] - **税友股份 (603171.SH)**:总市值320亿元,2024A归母净利润1.1亿元,2027E预测为5.1亿元;2024A市盈率284倍,2027E预测为62倍 [4] - **新大陆 (000997.SZ)**:总市值287亿元,2024A归母净利润10.1亿元,2027E预测为18.1亿元;2024A市盈率28倍,2027E预测为16倍 [4] - **汉得信息 (300170.SZ)**:总市值272亿元,2024A归母净利润1.9亿元,2027E预测为3.8亿元;2024A市盈率144倍,2027E预测为71倍 [4] - **虹软科技 (688088.SH)**:总市值216亿元,2024A归母净利润1.8亿元,2027E预测为4.2亿元;2024A市盈率122倍,2027E预测为52倍 [4] - **万兴科技 (300624.SZ)**:总市值177亿元,2024A归母净利润-1.6亿元,2027E预测为1.4亿元;2025E预测市盈率1330倍,2027E预测为125倍 [4] - **鼎捷数智 (300378.SZ)**:总市值160亿元,2024A归母净利润1.6亿元,2027E预测为2.9亿元;2024A市盈率103倍,2027E预测为54倍 [4] - **能科科技 (603859.SH)**:总市值121亿元,2024A归母净利润1.9亿元,2027E预测为3.6亿元;2024A市盈率63倍,2027E预测为33倍 [4] - **博思软件 (300525.SZ)**:总市值105亿元,2024A归母净利润3.0亿元,2027E预测为4.3亿元;2024A市盈率35倍,2027E预测为24倍 [4] - **赛意信息 (300687.SZ)**:总市值101亿元,2024A归母净利润1.4亿元,2027E预测为2.9亿元;2024A市盈率72倍,2027E预测为35倍 [4] - **润达医疗 (603108.SH)**:总市值100亿元,2024A归母净利润0.6亿元,2027E预测为3.6亿元;2024A市盈率181倍,2027E预测为28倍 [4] - **福昕软件 (688095.SH)**:总市值100亿元,2024A归母净利润0.3亿元,2027E预测为1.7亿元;2024A市盈率371倍,2027E预测为60倍 [4] - **新致软件 (688590.SH)**:总市值56亿元,2024A归母净利润0.1亿元,2027E预测为2.2亿元;2024A市盈率695倍,2027E预测为26倍 [4]
爆火的Skills如何给大模型加入“技能”?记者实测
贝壳财经· 2026-01-22 10:09
文章核心观点 - 一种名为“Skills”(技能)的AI新范式正在全球范围内快速普及,其核心在于将个人或组织的特定工作流程和隐性知识封装成标准化、可重复调用的模块,使通用大模型能够更精准、高效地完成具体任务,从而解决大模型“懂道理却不会干活”的痛点 [1][2] - 该范式自2025年10月由Anthropic旗下Claude首次推出后,在不到3个月内迅速获得OpenAI、微软、腾讯、字节跳动等国内外科技巨头的跟进与支持,从一个实验性功能演变为行业开放标准 [1][2][4] - “Skills”通过自然语言即可编辑和创建,降低了使用门槛,使得非技术背景的普通职场人士也能参与构建,促进了个人与组织经验的沉淀,并催生了“技能商店”等生态平台的出现 [2][3][6][8] Skills的概念与核心价值 - Skills被定义为能够将多轮提示词(prompt)及相关资源“封装”到一起的“标准化模块”,用于教会AI以可重复的方式完成具体任务,例如按照公司规范生成文档或自动化处理个人事务 [2] - 其核心价值在于解决通用大模型的痛点:大模型拥有知识,但缺乏散落在组织和个人经验中的“技能”,如特定代码框架、财务报销制度、品牌调性等,这些需要通过实践总结的隐性知识无法被模型直接调用 [2] - Skills可以将公司的规范、流程以及创造者本人的经验“沉淀”在模块中,使用时直接调取,无需重复输入提示词,实现了从“每次都得教一遍”到“学会一遍,终身受益”的转变 [8] 行业发展与巨头跟进 - 2025年10月16日,Anthropic为其AI模型Claude悄然推出Claude Skills功能 [2] - 一个月后的12月18日,Anthropic决定将Skills发布为开放标准,允许任何AI平台和开发工具实现该标准 [3] - 随后,OpenAI的ChatGPT出现了几乎一模一样的架构,微软、腾讯等旗下的编程工具也官宣支持Skills标准 [4] - 2025年1月19日,字节跳动旗下AI Agent平台“扣子”更新,上线“技能商店”,成为国内首个将Skills翻译为“技能”并推出类似功能的大厂 [1] - 截至2025年1月21日,Anthropic官方Skills库在GitHub上的星数已接近5万 [6] 功能实测与应用场景 - 实测显示,通过自然语言描述工作流程(如文章结构、标题样式)可快速生成定制化技能,例如“贝壳财经科技类文章写作技能” [6] - 生成的技能可通过输入范例文章和学习反馈进行迭代优化,从而产出更符合特定风格(如记者文风)和调性的内容 [6][7] - 技能商店中已出现多样化的应用实例,包括:创造历史课件、分析股票板块热度、创建新年绘本、自动化写作、地图数据可视化、生成AVG游戏、Markdown排版、法律类案检索等 [8][9] - 一个名为“花叔的自动化写作”的技能已有4800人安装,该技能运行迭代2个月20版以上,产出10篇以上1万+阅读文章 [8] 技术机制与行业影响 - Anthropic设计了“渐进式披露”机制以降低算力消耗:AI启动时仅扫描每个技能的元数据(约100 tokens),仅在需要执行任务时才加载完整的SKILL.md文件(约3000 tokens)和相关脚本,这使得一个智能体可以装备上百个技能而平时几乎不占用上下文 [10] - 行业形成共识,即“别造Agent(智能体)了,造Skills就行”,表明Skills被视为更具体、更可行的AI能力构建路径 [6] - Skills推动了工作流程的“原子化”,例如将信息搜集、处理和核验拆分为不同技能,未来企业的竞争力可能取决于其私有技能的数量与质量,以及将隐性知识转化为标准化模块的效率 [10]
Skills的最正确用法,是将整个Github压缩成你自己的超级技能库。
数字生命卡兹克· 2026-01-21 10:18
文章核心观点 - 利用先进的AI Agent平台(如Coze、OpenCode、Claude Code)及其Skills功能,可以将GitHub上成熟的开源项目快速封装成可调用的技能,从而让普通用户无需深厚技术背景也能便捷地使用这些强大工具,极大地扩展个人能力边界 [3][8][43] 方法论:将开源项目Skill化的具体流程 - 提出明确需求,使用具备强大搜索能力的AI模型(如GPT-5.2 Thinking)在GitHub上寻找对应的经典开源项目 [9] - 获取项目链接后,在支持Skills的AI开发环境中(如装有`skill-creator`的OpenCode),指示AI将该项目打包封装成一个Skill [11][12] - 建议在封装时先让AI进行规划(Plan模式),以提高成功率和后期稳定性 [12] - 首次运行封装好的Skill时,推荐使用GPT 5.2 Codex以获取更好体验,AI会指导解决运行中遇到的环境配置等问题 [22][24] - 将首次运行积累的经验和解决方案反馈给AI,让其更新Skill文件,从而实现后续使用的快速启动和固化 [29][30] 成功案例与应用场景 - **视频下载**:将拥有143k星标、支持上千个网站的`yt-dlp`项目封装成Skill,实现快速视频下载,首次运行后再次使用仅需十几秒 [10][18][28] - **网页转桌面应用**:将拥有45k星标的`Pake`项目Skill化,可一键将网页项目打包成轻量级桌面APP [33][35] - **格式转换**:将多个顶级格式转换开源项目(如FFmpeg、ImageMagick)封装成一个万能格式转换Skill,解决多种格式转化需求 [4][37] - **网页存档**:将`ArchiveBox`项目转为Skill,可以多种格式保存想要存档的网页 [37][38] - **密码破译**:将著名的`Ciphey`项目转为Skill,可在本地配合Agent进行密码破译 [39] 核心理念与价值主张 - 避免重复造轮子,直接利用开源世界数十年的积累,将经过时间考验、稳定高效的开源项目转化为个人可用的技能 [2][3] - AI和Skills技术降低了使用高级开源工具的门槛,使普通用户能够跨越复杂的环境部署和命令行操作障碍 [2][3] - 通过将开源项目Skill化,个人可以构建一个强大的、个性化的技能弹药库,背后是“全人类过去数十年的积累” [41][43] - 这种方法将曾经遥不可及的强大工具变得触手可及,显著扩展了个人的能力范围,创造了新的可能性 [42][44]
火爆全网的Skills,终于有了最简单的打开方式。
数字生命卡兹克· 2026-01-20 10:18
扣子2.0版本核心更新 - 产品更新至2.0版本,并更换了logo [1] - 本次更新引入了两个被作者认为非常实用且及时的核心功能:Skills(技能)和长期计划 [4] Skills(技能)功能详解 - Skills被视为继2024年Prompt工程、2025年上下文工程之后,2026年可能兴起的“Skills工程” [4] - 此前Skills功能主要集成在如OpenCode、CodeX、Antigravity等编程工具中,对普通用户门槛较高 [4] - 扣子作为一款Agent产品,集成Skills功能顺理成章,大幅降低了普通用户使用和创建Skills的门槛 [4] - 用户可通过在对话框输入“@”键来调用已拥有的技能 [4] - 官方内置了大量开箱即用的技能,涵盖写作、制作PPT、设计、视频处理等领域 [6] - 用户也可以使用他人创建并上架到技能商店的技能 [7] Skills的创建与抽象化价值 - 作者强调,未来个人的核心竞争力在于能否将重复性需求抽象成Skills并集成到主Agent中 [7] - 任何需要重复3次及以上的非沟通类任务,都应该被Skill化 [7] - 扣子平台的核心价值之一是帮助用户以极低成本将个人经验Skill化 [7] - 平台提供了两种创建技能的方式,分别面向普通用户和专业用户 [7] 面向普通用户的“口喷式”Skills开发 - 这是扣子上主流的技能构建方式,用户通过自然语言描述即可创建技能 [8] - 例如,用户可以将著名的开源多媒体处理工具FFmpeg的GitHub链接发给AI,要求其打包成一个用于视频格式转换、分辨率修改等功能的Skill [9][10][13] - 构建过程约需一两分钟,部署后即可在对话中调用 [14][15][19] - 实际测试中,调用该技能将一段视频转换为小于10MB的GIF,耗时仅几十秒,效果符合要求 [21][23] - 用户还可以将多个相关开源项目(如FFmpeg和ImageMagick)合并,创建一个能同时处理视频和图片的复合型Skill [24][25][27] - 此类复合技能可处理复杂连续任务,例如按要求将图片转为指定格式并调整视频分辨率,全程自动化处理仅需约2分钟 [29] - 创建好的技能可以上架到技能商店供所有用户使用 [30][32] 面向专业用户的Skills迁移 - 对于已通过Claude Code或OpenCode等工具创建了大量Skills的专业用户,扣子支持直接上传技能文件包(.zip或.skill格式)进行迁移 [33] - 系统会自动识别并创建技能,实现从其他平台到扣子的无缝平移 [33][37] - 目前部分迁移技能的运行成功率尚有优化空间 [38] Skills功能的当前局限与展望 - 目前扣子2.0上的技能只能单独使用,尚不支持多个Skill之间的互相结合与调用,这在一定程度上限制了其能力 [40] - 该更新对于降低Skills使用门槛、推动其普及具有重要作用 [39] - 补齐技能联动等关键短板后,AI助手的能力将得到质的飞跃 [58][60] 长期计划功能详解 - 长期计划功能允许用户为AI设定一个长期目标,AI会将其分解为可执行的步骤,用户只需按计划执行 [42][43] - 例如,用户可以创建一个“2026年全年健康执行路径规划”,AI会先了解用户当前身体状况,然后生成详细的阶段性规划书 [50][54] - 规划书内容系统,包含整体目标、阶段划分、关键里程碑和量化追踪指标体系等 [54] - AI会自动将计划任务添加到日程中,并在设定时间通过网页端弹窗提醒用户 [55] - 在计划执行过程中,用户可以通过与AI对话来不断调整和优化计划 [55] 长期计划功能的当前局限 - 目前计划提醒仅支持网页端,扣子的APP端尚未支持该功能的通知 [55] - 在移动端使用长期计划被认为是刚需,预计APP端支持会很快更新 [57]