Workflow
MCP
icon
搜索文档
20cm速递|MCP概念股强势表现!创业板50ETF华夏(159367)上涨0.74%
新浪财经· 2026-01-29 11:18
2026年1月29日,MCP概念股强势表现,创业板50ETF华夏(159367)上涨0.74%,持仓蓝色光标涨超 17%,昆仑万维涨超10%,网宿科技涨超9%。 创业板50指数聚焦信息技术、新能源、金融科技、医药等新质生产力赛道,成分股以科技龙头企业为 主,如光模块、芯片、新能源电池、创新药等领域。这些行业符合国家政策方向和全球科技发展趋势, 具有较高的成长性和创新性,是创业板50指数的核心竞争力所在。 消息面,MCP官方推出首个UI扩展"MCPApps",其核心是支持AI工具在对话中直接嵌入仪表盘、表 单、图表等交互式界面,打破AI仅纯文本交互的局限,迈向可视化、可操作的多模态工作流。 中银证券表示,随着MCP应用场景扩大,MCP的使用有望提升ai智能体开发效率和商业化落地速度。 MCP"即插即用"的特性有望显著提升ai智能体的开发效率,加速智能体的商业化落地。 创业板50ETF华夏(159367),该产品具备两大核心优势:一是20%涨跌幅限制,相较于传统宽基指 数,交易弹性更强;二是管理费0.15%、托管费0.05%,处于同类产品最低费率档,有效降低投资成 本。 ...
2026 年的「创业」,就从一个 Skill 开始吧
Founder Park· 2026-01-23 21:31
Skill概念的市场热度与生态发展 - 2026开年,Skill概念热度持续攀升,迅速超越Agent、MCP等概念,成为各家产品争相支持的功能[2] - 在过去十几天里,Skill生态正在以数倍的速度持续扩张[2] - Skill主张将专家的工作SOP打包成可复用的资源包,其特点是搭建不难、易于分享且能交付结果[3] Skill的核心优势与市场进入门槛 - 创建Skill不需要Coding或拖拽搭建工作流,只需一套可复用的SOP即可,门槛比Vibe Coding还低,旨在让人人都能成为创作者[3] - 扣子2.0率先跟进Skill功能并快速推出「技能商店」,显示出主流平台对该趋势的快速响应[4] Skill招募大赛概况与目标 - Founder Park联合扣子举办Skill招募大赛,旨在鼓励分享最佳SOP实践,让能力成为一种流动的交换资源[5] - 大赛核心理念是将可标准化的执行工作交给Skill,使人的能力和时间聚焦于决策和创造[6] 大赛赛道设置与具体要求 - 大赛设置职场和极客两个赛道,参与者可选择1个或多个赛题进行Skill开发[6] - **职场赛道**:征集将日常工作方法论、专业领域知识、复杂性流程封装为可复用能力的实用性Skill,以助力职场人提效减负[7] - **工作效率提升方向**:针对述职汇报、会议协作、项目跟进等高频办公场景,将个人SOP转化为可复用技能,如自动整理会议纪要并输出行动项[9] - **市场营销创作方向**:面向内容创作者与营销从业者,打造具备强交付能力的营销类技能,覆盖从内容策划到素材投放的全流程场景[10] - **金融专业分析方向**:面向金融从业者,打造满足一致性规范、可审计、强决策支撑核心需求的专业技能,如财报关键指标速读、行业动态跟踪[11] - **极客赛道**:聚焦视觉冲击力、技术门槛与代码能力、交互体验的「魔法感」,征集具备技术突破性与体验创新性的Skill[12] - **强视觉冲击特效方向**:鼓励打造高质量视觉特效能力,如酷炫粒子效果、沉浸式3D空间场景、玻璃拟态等,需支持与交互行为的联动并兼顾性能[13] - **可视化库封装与应用方向**:征集可作为Skill能力模块独立调用的可视化方案,如动态智能图表、交互式地图等组件封装[14] - **代码创意交互方向**:倡导基于编程语言实现具有创意表达的交互型技能,如网页动画生成、新颖手势交互逻辑或结合硬件能力的联动效果[15] - 以上方向仅作为创作参考,不构成对技能形态或实现方式的限制,开发者可自由融合多个方向进行创作[16] 赛事奖励机制 - 入选优质Skill将公布至扣子技能商店页面[17] - 提供流量扶持,为优秀Skill加码商店内曝光资源[17] - 对符合条件的优质Skill开放付费权限,开发者可实现创作变现[18] - Founder Park社区提供额外福利:极客赛道入选Skill奖励500元京东礼品卡,职场赛道入选Skill奖励300元京东礼品卡,名额共计10份,按报名顺序发放[19] - 提供扣子周边作为奖励,福利名额有限,按报名顺序依次发放[19] 活动赛程与参与方式 - 报名提交通道自即日起开启,至2月9日20:00截止[20][21] - 赛事仅接受报名通道开启后才创建的Skill报名[21] - 报名时需填写Skill ID或Skill链接,需至少完成Skill创建后再提交报名表单[22] - 活动赛程包括:征集启动与提交Skill(即日起至2月9日20:00)、专家团队调研评审(2月9日至2月13日)、获选结果公布(2月14日)、奖励发放(2月27日至3月6日)[23] 高质量Skill的构建标准与判断方法 - 一个快速判断Skill是否成立的方法是:看其方法论能否在固定输入条件下,稳定产出「可直接使用」的结果,且在该场景下的效果与确定性明显优于通用大模型工具[25] - 高质量Skill的核心标准是:具备专业领域知识(非通用Agent能完成),本质上是一个产品,应像一个高度专业的虚拟员工,能独立、可靠地完成一项完整、有价值的任务[26]
Skills 即个人资产
36氪· 2026-01-20 18:49
AI技能(Skills)的定义与价值 - 在2026年的AI语境中,“技能”被定义为用户发送给AI的“岗位操作手册”和“能力插件”,是将个人核心工作方法原子化并封装成可复用的工具 [1] - 技能能够将重复性操作提炼并压缩成可复用的技能包,实现效率自由,例如将新闻敏感度和缩写习惯封装后,AI可自动按固定“模具”生成稿件 [2][7] - 技能的应用场景广泛,包括自动生成PPT框架、将复杂文档提炼为可视化图表、批量处理图片格式以及整理优化零散想法等 [3][4][5][6] 高效AI工作流的核心组件 - 构建高效数字工作流需理解三个核心概念:MCP、Skills和子智能体(Subagent) [8] - MCP本质上是AI的“入场券”,解决数据访问权限问题,允许AI合法访问本地及实时私密数据,但其本身不负责数据处理 [8][9] - Skills是模块化的“能力包”,包含特定任务的指令、脚本和资源,采用“渐进式披露”设计,仅在触发任务时调用,不占用AI的常规注意力(Token) [9][10] - 子智能体(Subagent)实现AI的“分身术”,将复杂任务拆分为独立子任务分配给不同专岗子智能体处理,通过独立上下文窗口管理避免信息混乱 [11][12] 不同用户层级的Skills实践路径 - 第一类用户可通过“对话”封装直觉,将业务经验转化为数字分身,利用现有AI平台(如腾讯元宝、豆包)的聊天能力将模糊想法塑形为可直接调用的功能包,实现“经验SaaS化” [13] - 进阶玩家可让AI编写软件代码(如Python脚本)并封装成Skill,以处理更复杂或批量的任务,并可将技能分享至GitHub等平台 [14] - 最高级玩家构建完全自动化的数字生产线,整合MCP、Skills和Subagent,形成从数据访问、专业标准制定到资源调度的端到端工作流 [15] - 实际案例显示,有企业已将数据情报挖掘的全流程(包括数据调用和各类技能)封装成一个Agent,并形成持续的内容产出工作流,极大提升效率 [16] AI技能生态的发展趋势与商业影响 - 科技巨头正积极推动AI技能生态标准化,例如Anthropic联合Atlassian等推出Agent Skills开放标准,微软和OpenAI也在推进类似标准,旨在打破“数据孤岛”,使技能成为通用插件 [20][21] - 技能生态的发展背后是巨头对“定义工作流权力”的争夺,标准化后,掌握标准的公司可能收取全球AI流量的“过路费” [21] - 据CB Insights预测,到2030年全球AI Agent市场规模将达47.1亿美元,年复合增长率高达44.8%,其中AI技能包作为核心板块,预计将占据15%到20%的市场份额,是增长最快的细分领域 [22] - 技能的价值在于解决垂直领域的“最后一公里”问题,如医疗数据校验、金融审计插件等,大模型越普及,这些专业技能越具溢价能力 [23] - 未来AI工具将向“意图驱动”发展,用户只需提出模糊意图,系统可通过“意图协议”自动调用专业Skills组合,并按任务完成度向技能开发者结算,迈向“意图结算”终局 [23] - 这场Skills革命的本质是“隐性资产”的抢滩登陆战,未来最成功的创业者将是那些能将“行业手感”转化为“通用插座”的人 [25]
一文带你看懂,火爆全网的Skills到底是个啥。
数字生命卡兹克· 2026-01-13 09:05
Skills的概念与热度 - Skills是AI领域当前的热点概念,其热度在AI圈内已不亚于当年的Prompts [4] - 各种Skills相关的GitHub仓库受到广泛关注,例如一个包含50多个Claude技能的仓库已获得18K星标,另一个名为superpowers的基于Skills的开发工作流程项目也获得18K星标 [2][3] Skills的定义与核心特征 - Skills翻译为“技能”,是给AI Agent(智能体)使用的技能 [4] - 在形式上,Skills是一个文件夹,而不仅仅是文本,其中可以包含Prompt、参考文档、脚本等多种资源,供Agent在需要时加载 [23] - Skills的核心作用是**将流程性知识封装成可复用的能力包**,使Agent能够随需调用并稳定执行任务 [29] - Skills的设计采用了“渐进式披露”原则,即先加载元信息目录,再按需加载详细内容,以优化Token使用并降低认知负荷 [25][28] Skills与Prompt、MCP的区别 - **Prompt**:相当于对Agent(比喻为实习生)的**口头临时指令**,适合一次性、临场、可变的场景,其作用范围仅限于当前对话轮次 [25] - **Skills**:相当于给Agent的**内部SOP手册或知识库**,包含规范、脚本、模板等,可供Agent在需要时自行查阅并复用 [25] - **MCP**:相当于给Agent的**门禁卡**,其功能是让AI应用能够安全地连接和调用外部系统或API,不涉及具体任务执行方法的教导 [29][30] Skills的应用案例与价值 - **AI选题系统**:通过1个主控Agent和3个Skills(热点采集、选题生成、选题审核)实现自动化,将原本需要2-3小时的人工选题流程大幅简化 [4][5][6][7] - **整合包生成器**:通过Skill将复杂的GitHub开源项目(如Manim动画引擎)打包成带有前端界面的一键启动整合包,解决了非技术用户的痛点 [9][13][16][18] - Skills的价值在于**复用**,无论是专业人士封装工作流,还是普通用户固化常用需求,都能显著提升效率,其潜力被市场认为仍被大大低估 [18] Skills的技术规范与创建 - Skills由Anthropic公司于2025年10月在Claude Code上首次推出,并于2025年12月18日作为开放标准发布,从而引爆了生态 [19][21] - 一个标准的Skill文件夹**名称必须使用小写字母和连字符**(例如 `hotspot-collector`) [36] - 每个Skill文件夹中,**`SKILL.md` 是唯一必需的核心文件**,其结构固定为两部分 [37] 1. **YAML头部**:包含 `name` 和 `description` 字段,用于Skill识别 [37] 2. **Markdown主体**:详细的工作流程、输出格式要求和示例 [38] - `description` 字段至关重要,需使用**第三人称**清晰描述Skill的功能和调用时机,并包含触发关键词,同时建议将整个 `SKILL.md` 文件控制在500行以内以保证最佳效果 [38][39] Skills的生态与获取 - 除了Claude Code,OpenCode、Codex、Cursor、Codebuddy等主流编程工具均已兼容Skills标准 [23] - Anthropic官方开源了一个Skills仓库(`https://github.com/anthropics/skills`),提供了大量实用Skills,该仓库已获得**38.3k星标**和**3.5k分叉** [44][45] - 官方仓库中包含了16个示例Skills,涵盖文档处理、前端设计、PDF/Excel操作、Skill创建等多个领域,其中 `skill-creator` 这个Skill本身就可以指导用户创建新的Skills [45][46][47] Skills的安装与使用 - **安装方法一(命令安装)**:在Claude Code或OpenCode中,直接向AI发送包含Skill项目地址的Prompt指令即可完成安装 [49][51][52] - **安装方法二(手动放置)**:将Skill文件夹拖放到指定本地目录 [54] - Claude Code路径:`~/.claude/skills` [55] - OpenCode路径:`~/.config/opencode/skill` (macOS/Linux) 或 `C:\Users\[用户名]\config\opencode\skill` (Windows) [55][56] - 建议将Skills安装在全局目录,以便在所有项目中共用 [56] - 使用Skills时,用户只需通过自然语言对话提出需求,Agent便会自动判断并调用相应的Skill来执行任务 [57]
豆包手机助手调整权限!AI手机是洪水,但不是猛兽?
36氪· 2025-12-06 12:21
豆包手机助手事件与行业反应 - 豆包手机助手因AI操作手机功能引发广泛争议,导致努比亚M153手机用户无法正常使用部分银行App及互联网金融服务[1] - 豆包手机助手发布公告重申其AI操作需用户明确授权,执行任务中用户可随时中断,操作第三方App遇到敏感授权需用户二次手动确认[1] AI Agent技术对移动互联网生态的冲击 - GUI-Agent技术方案的出现打破了全球互联网生态长期建立的入口逻辑,用户过去进入App需经过搜索、点击、跳转等步骤,每一步都关联着应用自身的分发、引流及商业化策略[3] - AI Agent能直接替用户完成发微博、点外卖等操作流,导致原本属于应用的流量体系分崩离析,GUI-Agent方案使用户无需看屏幕,导致广告曝光率为零[4] - AI Agent代操作的“全托管”性质引发公平性争议,例如全自动“红包助手”被视为“红包外挂”,微信要求最终点击红包步骤必须由用户亲手完成以界定违规[5] 互联网公司的应对与风控挑战 - 第三方应用无法判断敏感权限是用户亲手确认还是被诱导授予,只能以安全风控为由停止服务进行排查[3] - 大多数风控系统设计从未考虑“用户授权AI完成任务”的可能性,只能用已有逻辑判断风险,突飞猛进的技术将双方带入“规则真空区”[11] - 互联网公司对AI手机态度谨慎,豆包手机助手理念被认为过于超前,其GUI-Agent方案对移动互联网生态造成冲击[3] AI Agent的功能定位与用户需求 - AI Agent作为革命性效率工具,替用户执行任务是基本能力,若只能识别内容、回答问题则永远只是助手而非Agent[12] - 用户对AI Agent真正感兴趣的是其能否替代重复机械劳动,如点餐、抢票、找便宜货、整理消息、提交表单等规则固定但耗时的工作[14] - AI Agent的“能代理”能力是其及格线,工具本质是用来提升效率,将用户从“不直接产生价值”的重复劳动中解放[12][14] 未来协作模式与行业转型方向 - AI Agent与App“对立”状况不会持续太久,未来两者将以全新方式协作,App开发者可能与AI手机品牌明确“允许AI操作”的范围,引入数字签名或授信制度,为常用AI Agent操作“开白名单”[16] - 互联网企业需完成从“界面入口”到“能力接口”的转型,在AI Agent时代体现独特价值[16] - 随着MCP协议普及,AI手机品牌或能摆脱事件注入触发、屏幕捕捉等技术路径,以更合理安全方式实现AI Agent互联互通,让所有相关方在可控框架下运作[17] - 技术成熟后,手机使用方式将彻底变化:用户给出方向指令,AI Agent负责“动手”,第三方平台组件提供执行,形成彼此依赖的协作结构[19]
Gartner:AI大模型触达天花板,警惕“贴牌智能体”
21世纪经济报道· 2025-11-10 22:35
市场趋势与阶段转变 - 生成式AI和代理型AI是塑造中国AI市场发展的两大核心主题[2] - 大语言模型已越过市场期望顶峰,热度趋冷并开始滑向“泡沫破裂低谷期”,市场在经历“百模大战”后趋于理性[2] - AI市场趋势正从“模型”向“智能体”转移,因大语言模型能力已到天花板,性能边际提升有限[4] - 中国企业将生成式AI部署到生产环境的比例从2023至2024年的6%至8%,在2025年暴涨至40%,预计当前已达60%至70%[6] - 2025年企业对生成式AI的“尝鲜期”结束后,2026年将正式进入“AI下半场”[6] 技术发展与竞争格局 - 国际AI模型评测显示,OpenAI从2022至2023年保持领先,但已进入“Frog Leap”式混战,国内DeepSeek、千问、Kimi等模型已进入第一梯队[5] - 各家模型性能提升空间有限,领先优势微乎其微,实际使用起来区别不大[5] - 模型厂商数量正在减少,出现收购、并购和价格战[5] - 未来模型发展方向是从“大”转向“精”,通过小语言模型和领域专业模型实现精细化、场景化突破[5] - 大语言模型并非万能,未来更强的AI系统需要结合多种技术,混合系统比只依赖大模型更有效[6] 企业应用与价值实现 - 中国AI产业正从尝鲜期进入价值兑现期,数据质量与治理能力将取代模型性能成为核心竞争力[4] - 到2027年,优先考虑准备AI就绪型数据而非生成式AI模型开发的中国企业中,80%实现的业务价值将是同行的两倍[4][6] - 传统企业在AI应用上仍面临巨大挑战,AI是系统工程,涉及企业方方面面的改造,部分企业光做数字化转型就要三年[7] - 互联网和高科技企业在AI应用上将走得更快,因其系统架构新、API友好、数据管理规范、企业文化接受度高[7] - 生成式AI时代对高质量数据有很高要求,企业若无法提供高质量的“上下文”数据,再强的模型也无法产生价值[6] AI智能体现状与挑战 - 行业存在严重的“Agent Washing”现象,即把普通聊天机器人宣称为智能体,市面号称的智能体可能10个里面有8个名不副实[8] - AI智能体演进经历了三个阶段:聊天机器人、智能助手、智能体,当前可能刚刚跨入智能体的大门,处于从助手向智能体过渡的阶段[8] - 真正的AI智能体需具备三要素:感知世界、自主决策、执行行动,最终与环境形成闭环反馈[9] - 大模型在语言理解上可评四星半,行动能力四星,但针对企业复杂场景的决策能力只有三星,仍然较弱[9] - 市面上很多所谓智能体为了可靠性,仍基于写死的工作流程,难以做到智能化,根本原因是智能体可靠性不足,完全依赖大语言模型做决策像“算命”[9] - MCP的理想状态是互联网中智能体和工具处于开放状态,可通过统一协议调用,但其价值被高估,实际应用中的异常处理、安全、性能都是问题[9]
一篇论文,读懂上下文工程的前世今生
36氪· 2025-11-07 15:11
上下文工程的定义与本质 - 上下文工程被定义为设计和优化上下文的收集、管理、使用,以提升机器理解和任务表现的努力 [4] - 其本质是通过建立更丰富有效的上下文,弥合人类高熵表达与机器低熵理解之间的认知鸿沟,达成系统性的熵减过程 [3] - 该学科并非全新概念,在AI技术出现前已发展超过20年,目前处于上下文工程2.0时代 [5] 上下文工程的发展阶段 - **1.0时代 (1990年代-2020年)**:核心是翻译,通过图形界面和编程语言将人类自然语言意图工程化为机器可理解的交互流程 [7] - **2.0时代 (2020年至今)**:随着GPT-3发布,用户可直接用自然语言对话,但熵减需求转移至用户身上,催生了提示词工程 [11][13] - 2.0时代典型系统包括ChatGPT、LangChain、AutoGPT,核心机制为提示工程、RAG、CoT、记忆代理,上下文容忍度和类人程度相对更高 [12] AI与人沟通的理解差距根源 - AI感官残缺,仅能获得用户明确输入,无法像人类一样接收文字外的大量环境信息 [14] - AI理解能力有限,难以处理和整合复杂逻辑及图像中的关系信息 [14] - AI存在记忆缺失,Transformer架构有长上下文性能瓶颈,缺乏长期记忆系统,难以捕捉长距离依赖关系 [14] - AI注意力涣散,面对海量信息时存在“上下文选择困难”,不知该关注何处 [14][15] 上下文工程的核心构件 - **构件一:上下文收集与记忆系统**:通过多模态融合和分布式收集修复感官残缺,通过分层内存架构解决记忆缺失 [16][18][21] - **构件二:上下文管理**:通过上下文抽象实现“自我烘焙”,将高熵上下文预处理为AI能理解的低熵结构,方法包括自然语言摘要、模式化提取、在线蒸馏 [23][24] - **构件三:上下文使用**:构建高效上下文选择机制,通过理解逻辑依赖、平衡新近度与频率、主动需求推断来解决注意力涣散问题 [25][26] 上下文工程的未来演进 - **3.0时代**:机器智能达到人类水平,能处理情绪等复杂上下文,主动理解场景并与人类协作,但长期记忆问题仍未完全解决 [30] - **4.0时代**:机器智能达到“超人智能”,人机交流的熵被彻底消除,上下文工程本身将消失或融入核心架构 [30][31] - 当前的技术如工具使用能力正从外挂演变为标准协议并融入模型核心,遵循脚手架最终融入基础架构的普遍技术发展模式 [32][33][34]
大厂AI模型专题解读
2025-09-28 22:57
行业与公司 * 行业为人工智能大模型,特别是中国国内的大模型行业,涉及的公司包括阿里巴巴、字节跳动、腾讯、百度、快手、Meta、谷歌、OpenAI等 [1][2][4][5][7][15][18] 核心观点与论据 **国内外大模型差距** * 国内大模型在基础架构上依赖海外提出的Transformer、MoE等,缺乏自研突破性架构创新 [1][2] * 国内AI大厂的GPU算力远低于海外巨头,受中美贸易战影响,差距通常高出一个量级 [1][2] * 商业模式差异导致模型上限存在差距:国外如GPT追求顶级性能(例如OpenAI的GPT Pro月费200美元,号称媲美博士级别),而国内模型更侧重推理成本控制和性价比,以适应国内用户消费习惯 [1][2] * 在多模态商业化落地方面,海外具有先发优势,用户量和收入领先国内一个量级,例如音乐生成领域海外最好模型Suno的收入大约是国内最好产品的10倍 [18] * 国产多模态模型在长文本理解、多样化场景处理及泛化性方面与海外领先水平存在差距 [7][8] **国内大模型的优势与特点** * 国内数据法律相对宽松,成为追赶海外大模型的一项优势 [1][3] * 国产多模态模型聚焦国内场景(如电商广告、短视频等),生成内容更贴近国人需求,在性价比和成本控制上优于海外模型 [1][7][8] * 国内模型更注重实际应用和成本效益 [1][2] **公司战略与布局** * 阿里巴巴采取几乎全开源策略,包括完整的模型权重、代码及训练数据,以扩大影响力,并整合其云服务系统形成闭环互利模式 [1][4][15] * 阿里巴巴通过提供不同参数大小版本和公开打榜测试来提高可信度,因此开源认可度较高 [1][4] * 字节跳动依靠独占基础模型优势,在C端商业化同时加固技术壁垒 [15] * 百度侧重B端技术落地与整合,不参与开源及C端竞争 [15] * 部分前期投入基础模型但无法追赶上的公司转向应用开发,并将之前的架构和细节开源 [15] **技术架构与发展** * MoE(Mixture of Experts)架构已成为大模型标配,通过门控系统分配输入内容给对应专家系统处理,降低计算成本和推理时间 [1][10] * MoE架构未来优化方向包括精准入口分层、专家系统结构差异化和训练稳定性(解决某些专家系统过劳或躺平的问题) [1][10] * 2025年开始,Agent技术成为重点发展目标,其优势在于整合完整链路(前置用户理解、调用工具、结合自身能力生成完整系统) [16][22] * 到2026年,MCP(Multi-Chain Protocol)概念将普及,解决不同上下游数据输入输出连接问题,降低工具集成成本 [2][22] * 未来模型算力尺寸将大幅缩小,实现降本增效,并部署在端侧设备上,自监督模型强化将减少对人为参与和数据标注的依赖 [2][22] **多模态模型发展** * 国内各大厂商(阿里、字节、腾讯、百度、快手等)均在积极布局多模态模型,涵盖文本、图像、音频、视频、3D生成等领域 [5][6][7] * 代表性产品包括阿里的天工GL、OMI和通义万象,快手的可灵,腾讯的混元,字节的豆包等 [7] * 3D生成是国内新兴领域,但数据处理和训练成本高,下游应用尚不明确,目前主要集中于VR场景生产 [18] **行业经济性与商业化** * 从2024年中期开始,大模型API和C端定价降低,原因是前期大量企业投入预训练导致GPU算力资源稀缺,后期部分厂商放弃训练,算力资源释放,加上技术进步(如云浮加速优化),导致成本下降 [2][13] * 尽管用户付费减少,但由于成本降低,对企业收入仍产生正向影响,行业整体成本转化率增加 [13] * C端主要采用订阅制,B端API市场较为混乱,不同厂商的API被下游公司整合成C端产品出售,增加了用户选择但也提升了大厂运营推广成本 [14] * 国内用户对收费服务接受度低,付费转化率大约在3%至5%,30日留存率仅为3%至6% [20] * 成功的AI产品案例(如AI陪玩对话系统)通过结合情感陪伴和专业功能来吸引用户付费 [21][22] **挑战与未来展望** * 端侧AI设备(如机器人、眼镜)融合面临挑战:模型部署在设备上需解决成本、重量、续航问题;部署在云端需克服互动性、延时性及网络问题 [19] * 预计眼镜或头戴式运动装备将优先实现端侧AI融合 [19] * 国内免费的大厂对话机器人及多模态产品月活跃用户数达数千万,但免费策略的可持续性待观察,未来需探索付费转化路径 [19] * 幻觉问题的改善主要依赖数据质量和训练方法(如让模型识别自身不了解的信息),预计到2026年底通用大模型幻觉率将有显著改善 [10][11][12] * 展望2026年,关键技术突破可能包括Agent技术普及、模型算力尺寸缩小、自监督模型强化,目标是实现ASI(Artificial Super Intelligence) [22] 其他重要内容 * 短剧内容与AI剪辑工具融合方面,生成与编辑是不同方向,部分厂商转向编辑功能,但目前编辑功能仍处于辅助地位 [9] * 海外市场目前尚未有一键生成短剧或剧本内容的AI视频多模态工具,未来可能需要剧本大模型与agent链路结合来实现 [9] * 在基于剧本大模型做落地产品方面,可灵和奇梦两家公司已进行相当成熟的系统研究(但涉及机密信息未透露具体厂商) [10]
人工智能行业专题(12):AIAgent开发平台、模型、应用现状与发展趋势
国信证券· 2025-09-10 23:25
投资评级 - 行业投资评级为优于大市(维持)[1] 核心观点 - AI Agent是突破指令执行的智能实体 具备代理权 可主动感知 自主决策并执行复杂任务 在AGI分级中处于L3智能体阶段 性能等效90%熟练成年人[3] - AI背景下AI基础设施层面临重构 客户将重新选择云/AI平台 云厂商加大布局AI/Agent平台瓜分新市场[3] - 海外模型呈现差异化发展 国内模型层并未拉开显著差异 2025年初深度推理与长上下文模型发布推动Tokens调用量快速提升[3] - 应用C端重磅搜索产品依赖模型能力与生态导流 图像与编程类产品发展迅猛 应用越偏向垂类则技术门槛越低 产品理解要求越高 竞争越激烈 商业化闭环越容易[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 机遇与挑战并存 企业落地仍面临幻觉 数据安全 成本高等问题[3] - 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5% CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元(CAGR 44.9%)[3] Agent定义、技术与发展 - AI Agent具备自主性 规划力与执行力 核心突破在于赋予代理权 可主动感知环境 自主规划决策 执行复杂任务[10] - 关键特性包括自主决策 动态学习 跨系统协作 核心模块包括感知层 记忆层 决策层 执行层[10] - 与LLM和传统自动化的关键区别在于LLM是知识顾问 Agent是战略指挥官 传统自动化仅规则执行 Agent实现端到端任务闭环[10] - 在AGI分级中 Agent处于L3智能体阶段 性能等效90%熟练成年人[11] - 代理核心构成包括记忆 感知 规划 工具使用[12][15] - 相关技术创新包括MCP(模型上下文协议)和A2A(Agent-to-Agent通信协议)[16][19] - Agent市场图谱分为基础设施类 横向职能类 垂直应用类三大类别[20][22] Agent开发平台的布局 - 海外云厂商平台布局对比:微软聚焦B端基础设施 模型支持最全面 工具链和生态整合全面 安全与稳定性强 谷歌兼顾B/C端多场景 多模态强但生态不成熟 市占率较低 亚马逊依托AWS服务中小企业 侧重算力销售与便捷部署但工具链分散[51] - 国内平台布局对比:字节扣子覆盖全场景 开发者与智能体数量领先 阿里百炼主攻B端全行业 服务30余万企业客户 MCP工具链和开源生态丰富 腾讯元器基于混元大模型 主打轻量化低代码开发 聚焦社交与游戏垂类[55] - 微软Azure AI Foundry已被80%财富500强企业使用 25Q2处理tokens超500万亿 同比增长超7倍 agent service客户数达1.4万[42] - 谷歌AI平台架构涵盖数据综合层 控制层 数据层 业务活动层 赋能基础设施包括TPU v7 Ironwood和英伟达支持[48][49] - PaaS/Agent平台面临市场份额重构机会 IDC调查显示70%受访企业将更换或新增云/AI平台供应商[56] - 平台关键需求包括提高开发交付效率 AI驱动的工作流自动化是首要需求 安全与隐私是最大落地障碍[62][63] - 企业AI战略重心分层 核心模型能力是第一抓手 云服务商在助力实现AI目标的供应商中占比49%[68][70] 模型层与Tokens调用量分析 - 根据Openrouter数据 谷歌Gemini与Anthropic Claude占API市场半壁江山 国内DeepSeek 阿里Qwen系列份额稳步提升[3][95] - 谷歌2025年7月调用量980万亿tokens 较去年增长100倍 其中内部需求占比高达97%[3] - 国内字节豆包2025年5月日均tokens 16.4万亿 增长137倍 内部占比超80%[3] - 海外模型差异化发展:OpenAI技术路径领先 聚焦推理与专业能力 谷歌端到端原生多模态领先 Anthropic编程场景领先 实用性突出[102][103] - 国内模型未拉开显著差距:DeepSeek技术研究领先 阿里自研能力与综合能力强 字节各模态均衡 百度中文场景优化 腾讯基于DeepSeek改造[105][106] - 分场景份额:编程场景Claude Sonnet4占近半调用量 角色扮演场景DeepSeekV3领先 科技金融场景Claude Sonnet4与Gemini Flash占优 营销搜索翻译场景Gemini Flash优势明显[108][111][113] - 过去半年模型周tokens消耗量增长4.7倍 深度推理与长上下文模型发布推动调用量快速提升[122][123] C端与B端Agent进展 - 应用C端重磅搜索产品依赖模型能力与生态导流 ChatGPT MAU预计年底超10亿 Gemini MAU 4.5亿 国内夸克 元宝依托生态导流[3] - 图像类Midjourney ARR 5亿美元 可灵月收入1.5亿元 编程类Cursor ARR 5亿美元 GitHub Copilot Web MAU 1.2亿[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 微软Copilot家族月活用户已超1亿 但企业落地面临幻觉 数据安全 成本高(Agent调用成本为LLM 15倍)等问题[3] - 根据CBINSIGHTS 企业工作流 编码两大领域2024年营收均超10亿美元 微软Microsoft Copilot 2024年收入约8亿美元 GitHub Copilot收入约6亿美元 总占整体市场超25%份额[25] - 垂类市场中客户服务 软件开发为高潜力赛道 64家组织中2/3计划12个月内用AI代理支持客服[25] Agent的市场空间与发展预期 - 根据IDC数据 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5%[3] - CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元 CAGR 44.9%[3] - 根据Garnter与IDC 短期(2023-2025)GenAI嵌入现有应用 中期(2025-2027)Agent成核心组件 长期(2027+)自主代理网络主导业务 2035年后Agent将成为认知共生的人类助手 智能体即应用将成主流[3]
2025Agent元年,AI行业从L2向L3发展
2025-08-28 23:15
涉及的行业或公司 * AI行业 特别是人工智能代理(Agent)领域[1][5][17] * 涉及公司包括OpenAI、谷歌、Deepseek、Cursor、Devin、Metas、Salesforce、苹果、Manas、Genspark、Minimax等[1][4][16][18][19][21] 核心观点和论据 **技术发展推动Agent爆发** * 底层模型突破是Agent发展的关键 如Deepseek R1推理模型使Agent能执行复杂任务[1][6] * 模型在预训练、强化学习、推理能力、编程能力、多模态能力等多个维度有明显提升[3] * MCP(Multi-Context Processing)技术推出显著提升Agent能力 简化大模型与工具交互过程[3][9][11] * 底层模型成功率对任务执行至关重要 多步骤任务需高成功率保证最终结果[10] **市场需求驱动发展** * 从2022年底ChatGPT推出到2023年模型竞赛 市场一直在等待能带来生产力提升和降本增效的工具[1][3][7] * 早期AI应用如Chatbot未能达到预期效果 被视为"玩具"[7][8] * 2025年市场需要看到AI带来的实际降本增效、营收增长及客户满意度提升等明确效果[1][14] **产品类型与能力定义** * 主流Agent产品分为三类:编程类(Cursor、Devin)、研究型(谷歌、OpenAI的Deep Research)、综合性应用(Metas)[4] * 真正意义上的Agent产品需具备五项核心能力:对话能力、推理能力、长记忆能力、调用工具能力以及规划能力[15] * 目前多数Agent仍处于半自动状态(human in the loop) 完全自动化产品失败率较高[15] **发展阶段与重要性** * Agent处于L3阶段 具备聊天、推理及动手能力 是从L2到L4的重要过渡环节[1][5] * Agent不仅是效率提升工具 更是通往AGI的关键环节 会影响未来互联网流量入口格局[5][18] 其他重要内容 **开源生态影响** * 开源生态通过MCP等技术降低开发门槛 促进技术共享与创新 加速行业发展[1][9] **竞争格局差异** * 垂直型Agent因聚焦单一领域而落地更快 工作流明确且高频重复 已签约大客户并带来收入增长[20][25] * 通用型Agent目前成功率较低且缺乏明确商业场景 但代表未来竞争方向 是用户流量入口[20] * 科技巨头将在通用型Agent领域展开激烈竞争 初创公司可能面临闭源模型API服务停止的风险[24] **资源消耗与成本** * Agent普及将大幅增加tokens消耗 完成一个任务通常需要多个步骤 每个步骤都需消耗大量tokens[19] * 一些人工智能服务如Manas、Genspark、Minimax等 完成一个任务约需10元人民币[19] * 智能体目前消耗大量tokens成本 而订阅费用与成本之间存在错配问题[24] **投资建议与市场展望** * 未来几年AI智能体将围绕工具调用、规划、记忆及可靠性迭代 垂直领域智能体先行落地[2][26] * 长期配置平台巨头 关注足够垂直且壁垒深厚的玩家[2][26] * 行业估值可能回归理性 有利于长期健康发展[27]