Agent
搜索文档
阿里Qwen技术负责人林俊旸:模型即产品,做模型就是在做产品
新浪财经· 2026-01-11 10:40
行业核心理念 - 基础模型即产品 研究人员需像产品经理一样将研究成果转化为真实世界可用的系统 [1][3][5] - 伴随主动学习发展 Agent将具备长时间托管式工作能力 在执行通用任务中自行进化并决定行动路径 [3][5] - Agent的潜力取决于其与环境的深度交互 持续理解用户与环境至关重要 [3][5] Agent技术发展方向 - Agent可走向虚拟世界和物理世界 由此产生具身推理概念 [3][5] - 目前交互主要停留在电脑数字环境 未来进入真实物理世界指挥机器人进行现实交互与操作是关键发展方向 [3][5] - 进入物理世界是实现承担长周期、高价值任务的前提 [3][5] 市场机会判断 - 对于通用Agent而言 长尾应用是更值得关注的事情 也是AI更大的魅力所在 [3][5] - 与马太效应相反 头部应用反而相对容易解决 长尾领域可能蕴含更大机会 [3][5]
未来走向何方?Agent 创企 2025 生存现状一览
机器之心· 2026-01-11 09:30
2025年Agent行业热度与市场接受度 - Agent成为2025年人工智能领域的核心议题,市场热度与实际商业化进展之间存在落差[6] - Meta于2025年12月30日以超过20亿美元收购Manus,被视为Agent模式的里程碑事件[7] - 观点认为Agent热度主要源于工具使用能力的突破,随着MCP通用接口普及,Agent能更高效调度外部系统[7] - 市场竞争焦点从比拼模型参数转向看重“模型+生态工具”的组合能力[8] - 根据谷歌云报告,已有52%使用生成式AI的企业在生产环境中部署了Agent[8] - BCG研究指出,应用高效的Agent可让业务流程提速30%-50%[9] - Salesforce研究表明,预计到2026年,80%的企业级应用将嵌入Agent能力[10] 2025年资本青睐的Agent赛道与代表公司 - 过去一年,融资过亿美元的美国Agent初创企业已超过20家,涵盖多个垂直领域[11] - **法律赛道**:Harvey于12月完成1.6亿美元F轮融资,估值达80亿美元,拥有7.4万律师用户[11];EvenUp于10月完成1.5亿美元E轮融资[11];Eudia于2月完成1.05亿美元A轮融资[14] - **搜索赛道**:Parallel于11月完成1亿美元A轮融资,估值7.4亿美元[12];You.com于9月完成1亿美元C轮融资,估值15亿美元[12];AI搜索独角兽Perplexity被曝于9月完成2亿美元融资[11] - **音频/对话式Agent**:ElevenLabs于12月融资1亿美元,估值突破66亿美元,正向“对话式Agent平台”转型[13] - **软件工程赛道**:Anysphere融资23亿美元,估值293亿美元[14];Cognition AI融资4亿美元,估值102亿美元[14];Replit融资2.5亿美元[14];Turing融资1.11亿美元,估值22亿美元[14] - **B2B客户服务赛道**:Sierra融资3.5亿美元,估值100亿美元[14];Decagon融资1.31亿美元,估值15亿美元[14];Glean融资1.5亿美元,估值72.5亿美元[14];Invisible Tech融资1亿美元,估值20亿美元[14] - **医疗健康赛道**:Hippocratic AI融资1.26亿美元,估值35亿美元[14];OpenEvidence融资2亿美元,估值60-120亿美元[14];Ambience Healthcare融资2.43亿美元,估值12.5亿美元[14];Abridge融资3亿美元,估值53亿美元[14];Tennr融资1.01亿美元,估值6.05亿美元[14] - **科学发现赛道**:Lila Sciences融资3.5亿美元,估值13亿美元[15];Periodic Labs融资3亿美元,估值12亿美元[15];Harmonic融资1亿美元,估值8.75亿美元[15] - **国防赛道**:Shield AI融资2.4亿美元,估值53亿美元[15]
打破学科壁垒!400篇参考文献重磅综述,统一调查「人脑×Agent」记忆系统
机器之心· 2026-01-10 12:06
文章核心观点 - 一篇由哈工大、鹏城实验室、新加坡国立、复旦、北大联合发布的综述,首次系统性地将认知神经科学的人脑记忆机制与人工智能中的智能体记忆进行统一审视,旨在为设计真正“类人”的智能体记忆系统奠定理论基石 [2] - 该综述横跨认知神经科学与人工智能两大领域,涉猎相关文献共400篇,旨在打破学科壁垒,推动智能体记忆系统的跨学科突破 [2] 记忆的定义与视角 - **重新定义记忆**:记忆不仅仅是数据的存储,更是连接过去经验与未来决策的认知桥梁 [4] - **人脑视角**:记忆是大脑存储和管理信息的过程,分为两个阶段:快速形成并整合新信息的神经表征阶段,以及随时间巩固或根据未来情况检索这些表征的阶段 [5] - **大语言模型视角**:记忆表现为三种形态并存,包括参数记忆、工作记忆和显式外部记忆 [6] - **智能体视角**:智能体记忆超越了LLM的简单存储,是一个动态的认知架构,嵌入在智能体与环境的动态交互过程中,与传统侧重于静态知识库查询的RAG有本质区别 [6] 记忆的核心作用 - 在智能体中,记忆系统充当关键主动组件,旨在实现三大核心作用:突破上下文窗口限制、构建长期个性化画像、驱动基于经验的推理 [8] - 记忆通过减轻上下文窗口限制、实现长期个性化以及驱动基于经验的推理来扩展智能体的能力 [10] 记忆的分类学 - **基于认知神经科学的分类**:人脑记忆分为短期记忆和长期记忆,长期记忆又可细分为情景记忆和语义记忆 [15][16][19] - **智能体的双维度分类**:为适应复杂自主任务,提出基于“性质”和“范围”的双维度分类法 [17] - **基于性质**:直接对齐人脑,分为情景记忆和语义记忆 [22] - **情景记忆**:存储完整的交互轨迹,提供过程性知识 [24] - **语义记忆**:存储事实、概念、规则和常识,提供陈述性知识 [24] - **基于范围**:根据记忆在任务流中的生命周期划分 [23] - **轨迹内记忆**:临时工作区,仅在当前任务或会话中有效 [24] - **跨轨迹记忆**:永久存储库,存储可概括的模式、学习的策略、可重用的知识 [24] 记忆的存储机制 - **人脑记忆存储**:是一个跨脑区的动态协作过程 [27] - **短期记忆**:存储位置分布在感觉皮层和额顶网络,存储形式包括持续活动和活动-沉默突触连接 [31] - **长期记忆**:存储涉及海马体和新皮层,海马体充当索引,新信息通过系统巩固转移到新皮层永久存储,存储形式包括事件单元和认知地图 [31] - **智能体记忆存储**:是显式的工程构建,需在存储位置和存储形式上进行设计以平衡计算成本与推理能力 [32] - **存储位置**:包括上下文窗口和外部记忆库 [39] - **存储形式**:包括文本、图结构、参数和隐式表示 [39] 记忆的管理系统 - **人脑记忆管理**:是一个充满可塑性的动态循环,包括记忆形成、更新、检索和整合 [36][38] - **记忆形成**:包括编码和巩固两个阶段 [40] - **记忆更新**:核心驱动力是预测误差,策略包括分化和整合 [44] - **记忆检索**:具有重构性,回忆过程可能伴随再巩固,导致记忆被修改或增强 [44] - **智能体记忆管理**:是一个由记忆提取、更新、检索和应用组成的精密闭环 [41][43] - **记忆提取**:分为扁平提取、分层提取和生成式提取 [45] - **记忆更新**:分为针对上下文窗口的轨迹内更新和针对外部记忆库的跨轨迹更新 [45] - **记忆检索**:主要分为基于相似度的检索和多因素检索 [48] - **记忆应用**:主要分为上下文利用和参数内化两种范式 [48] 记忆系统的评测 - 综述将现有的评测基准分为两类:面向语义的基准和面向情景的基准 [47] - **面向语义的基准**:重点关注智能体如何构建、维护和利用其内部记忆中的信息状态,列举了如MemBench、LongMemEval、MemoryBank等超过20个基准及其数据量 [47] - **面向情景的基准**:旨在评估复杂下游应用场景中智能体记忆系统的实际性能增益,列举了如WebArena、ToolBench、GAIA等超过10个基准及其数据量 [49] 记忆系统的安全 - **主要攻击方式**:分为窃取攻击和投毒攻击两类 [51] - **窃取攻击**:利用精心设计的提示诱导智能体泄露长期记忆中的敏感信息 [55] - **投毒攻击**:向记忆库注入恶意数据以植入后门或进行认知污染,改变智能体行为或使其判断力退化 [55] - **防御体系**:提出三道防线构筑闭环防御 [51] - **检索防御**:在智能体读取记忆前进行清洗和验证 [55] - **响应防御**:在智能体生成回答时引入审查或自我反思机制进行监控 [55] - **隐私防御**:在底层存储上将记忆分区,对敏感数据进行匿名化处理 [55] 未来展望 - **多模态记忆**:未来的记忆系统需要是全模态的,能统一存储与表示文本、图像、音频和视频等多模态信息,使智能体真正理解物理世界 [53][56] - **智能体技能**:借鉴“Agent Skills”概念,将指令集、可执行脚本等封装成结构化单元,以解决不同智能体间记忆难以移植重用的问题,实现跨智能体的技能转移和适应 [54][56]
下一个万亿AI赛道,上下文图谱,才是AI创业的真正机会
36氪· 2026-01-09 20:39
在硅谷,围绕一个问题的争论正在升温: AI,尤其是 Agent,会不会取代 SaaS? 最早给出明确判断的是SaaS 领域的知名专栏作者 Jamin Ball。 在《Long Live Systems of Record》一文中,他直言不讳地反对"Agent 会杀死一切旧系统"的说法。 她在最新文章《人工智能的万亿美元机遇:上下文图谱》中指出,传统系统的盲区不在于"数据",而在 于"上下文"匮乏。 企业真实的运行逻辑,往往不记录在CRM 的标准化表格里,而是藏在例外的特批、临时的调整、跨部 门的 Slack 沟通中。 Gupta 将这些隐性的过程定义为「决策轨迹」。 当这些决策轨迹被持续记录,并在时间和业务对象之间连接起来,就会形成一种新的结构——上下文图 谱。 这不仅是数据的堆砌,更是对企业"推理过程"的复刻。下一个万亿级平台的机会,不是给旧系统装上 AI,而在于谁能抓住这些"数据"与"行动"之间的灰色地带。这才是AI创业公司需要抓住的真正机会。 今天,我们就来拆解这个超级赛道的核心逻辑。 01 上下文图谱:AI 时代企业最值钱的"第二资产" 上一代企业软件通过成为"记录系统"(Systems of Rec ...
券商晨会精华 | 2026年炼油、页岩油、天然气领域凸显红利
智通财经网· 2026-01-08 12:18
市场行情与板块表现 - 沪深两市成交额2.85万亿元,较上一交易日放量476亿元,成交额连续2个交易日超2.8万亿元 [1] - 商业航天概念反复活跃,十余只成分股涨停,雷科防务6连板,金风科技2连板 [1] - 煤炭板块持续拉升,大有能源、陕西黑猫涨停 [1] - 半导体设备股延续强势,中微公司、北方华创大涨续创历史新高 [1] - 光刻胶概念表现活跃,国风新材3天2板,南大光电、彤程新材涨停 [1] - 截至收盘,沪指涨0.05%,深成指涨0.06%,创业板指涨0.31% [1] 能源行业展望(2026年) - 预计2026年全球原油市场将正式进入供应过剩周期,国际能源署预计过剩规模达384万桶/日,油价中枢系统性下移 [2] - 炼油端裂解价差预计将高位运行,构成低油价环境下的核心受益方向 [2] - 美国页岩油在60美元/桶附近展现出产量韧性 [2] - 液化天然气扩张与电力需求将推动天然气并购升温 [2] 人工智能与科技行业展望(2026年) - AI叙事将向纵深演绎,市场焦点将从“模型迭代”转向“场景落地” [3] - 算力作为基础设施仍是压舱石,硬件层将迎来“自主可控”与“景气外溢”的双重共振 [3] - 对内看好国产算力与半导体设备在自主可控趋势下的系统级突围 [3] - 对外把握AI PCB与存储在全球需求共振下的超级景气周期 [3] - 应用层超额收益将源于Agent、多模态、AI+办公/Coding、情感陪伴及AI硬件的非线性增长 [3] - 头部模型与应用独角兽的资本化进程将为板块提供估值锚点与重估契机 [3] - 美股科技在业绩支撑下,20%的指数级收益仍是可预期的合理目标 [3] 先进制造行业分析 - 国内先进制造产业凭借完备的工业体系和效率成本优势,已在全球建立稳固竞争力 [4] - 新能源领域中,锂电规模与盈利能力全球领先,头部企业估值普遍低于海外龙头,性价比优势突出 [4] - 风电盈利能力弱于海外,但估值同样较低 [4] - 高端装备、新材料行业盈利能力与海外龙头相当,估值合理,但全球扩张仍有较大提升空间 [4] - 后续重点关注盈利能力突出、全球化布局深入的龙头价值重估,以及优质制造企业出海扩张的投资机遇 [4]
2025年全球支付的十条明线与暗线
搜狐财经· 2026-01-07 21:52
移动支付网消息(慕楚):2025年已经过去,对于全球支付产业来说,这一年的变化可谓翻天覆地。藉 此辞旧迎新之际,我们来盘点下2025年全球支付产业发展的10条明线与暗线。 1、稳定币成为全球支付关键基础设施 稳定币无疑是2025年全球支付产业的最大热词,《香港稳定币条例》、美国《天才法案》、欧洲 MiCA、Circle上市等热门事件,让稳定币迅速出圈,获得普罗大众的认可。然而新兴事物的发展必然带 来诸多争议,如弱势币种的抵制、系统性风险的考虑、传销与诈骗的盛行、反洗钱压力陡增等等话题, 但随着全球各大金融机构与支付巨头的认可,稳定币毫无疑问在2025年成为了全球支付关键基础设施。 2、全球CBDC发展的踌躇 在稳定币的全球强势兴起下,号称"官方稳定币"的CBDC大多踌躇不前。美国通过《天才法案》的同 时,还通过了《反CBDC监控国家法案》,全面禁止CBDC的发行;英国在7月考虑搁置数字英镑计划, 到年底则向企业征求数字英镑的价值;欧盟一直加速数字欧元的落地,但时间推迟到2029年;韩国在年 中暂停CBDC的二阶段试点,但经历韩元稳定币发展不利后,在12月再次启动该测试。 而我国在2025年上半年便开始准备将数 ...
为了让企业用好AI,云厂商们操碎了心
36氪· 2025-12-31 21:35
行业核心驱动力 - AI正在重塑整个云市场,成为云厂商增长的核心驱动力[3] - 越来越多的行业和企业意识到利用AI优化业务效率、创造价值的可行性,并急于付诸实践[3] - 云厂商的核心价值正从基础设施提供者转变为AI能力提供者,卖Token成为关键增长途径[1][6] 市场增长与规模 - 阿里云的AI相关收入已连续9个月实现三位数同比增长[1] - AWS判断未来MaaS平台带来的Token收入将和其EC2计算产品的收入不相上下[1] - 谷歌云的年化收益超过500亿美元,其中大部分增长由AI驱动[1] - 火山引擎将其千亿营收目标(原预计2029-2031年实现)上调了数百亿美元[1] - CoreWeave依靠AI算力租赁业务获得了数百亿美元市值[3] 竞争格局与战略动向 - 新锐云厂商正以更敏捷的动作拥抱AI,冲击原有行业格局[1] - 火山引擎坚持锚定「AI云」,将其视为重要的超车机会[1] - CoreWeave通过收购增强AI算力租赁之外的AI开发能力[1] - 腾讯和百度近期针对基础模型研发进行了团队调整,以加强投入[11] Agent成为价值焦点 - AI对企业的价值体现越来越集中在Agent的打造上[3] - Agent为发挥Token的价值提供了方法论和路径,是让Token产生价值的关键[4][6] - 未来几乎所有与计算世界打交道的软件都可能由大模型产生的Agent构成[4] - 行业对Agent市场给予积极乐观的预期,预计明年将呈现爆发式增长[4] Agent应用案例与效率提升 - AWS借助编程Agent Kiro,将一个原本需要30人工作18个月的项目缩短至6人用76天完成[4] - 火山引擎的一个企业客户在2024年开发了50多个Agent,到2025年增至200多个[4] - Blue Origin构建了超过2700个内部Agent,交付效率提升了75%[4] 企业面临的挑战 - 能够真正开发好、运营好并大规模使用Agent的企业并不多,通常需要深厚的技术积累[6] - 第三方调研数据显示,93%的客户在从概念验证迈向生产阶段时遇到重大障碍[6] - 主要障碍来自数据层面(概念验证数据经过优化)和工程化层面(大规模应用对安全、扩容等要求更高)[6] 云厂商的解决方案布局 - 云厂商正积极布局打造更完备、简便的Agent开发和落地能力[3] - 方向包括提供帮助企业高效搭建Agent的工具包,涉及模型定制化训练、Agent开发、运营和安全治理[3] - 需要一套为Agent开发和运行而设计的AI云原生架构来支持企业[7] 全栈式Agent开发平台 - 火山引擎推出了包含MaaS层易用性提升(Prompt Pilot、Response API)、推理代工、AgentKit全栈开发能力和HiAgent运营能力的完整解决方案[7] - AWS推出了开放式模型训练平台Nova Forge和企业级Agent开发框架AgentCore[7] - 谷歌云的Gemini Enterprise提供基础模型、无代码构建框架、专业Agent等六项核心组件,实现端到端Agent应用[7] - 腾讯云推出智能体开发平台(ADP),支持低代码/无代码构建[10] - 阿里云推出Agent开发框架ModelStudio-ADK,支持开发复杂Agent[10] - 百度云通过千帆平台提供完整的训练调优、推理部署等工具链[10] 平台能力关注重点 - 普遍重视降低Agent开发门槛、提升模型定制化能力和加强Agent安全控制[9] - AWS的Nova Forge允许企业基于自有数据训练模型,知识产权归企业所有[9] - Reddit、Booking和索尼已是Nova Forge的早期用户,Reddit训练的模型能理解小众文化[9] 基础模型演进 - 强大的自研基础模型是企业选择云平台的重要参考项[11] - 进化趋势是让基础模型更适配Agent开发需求[11] - 火山引擎豆包大模型1.8针对多模态Agent场景优化,增强了工具调用和复杂指令遵循能力[11] - 谷歌Gemini 3 Pro具备更强的自主规划、拆解任务和调用工具能力[11] 云厂商理念与指标转变 - MaaS业务的进展正在成为云厂商的一项核心指标[13] - 火山引擎已将AI的Token调用量视为核心指标,有销售因MaaS业务不佳而被淘汰[13] - 阿里云在11月传出提高MaaS业务优先级,将其作为业务长期成功关键指标的消息[13] - 阿里云提出要做「AI时代的Android」和「超级AI云」[13]
2025AI应用大爆发,2026普通人有什么机会?
36氪· 2025-12-26 16:59
全球AI产业现状与利润结构 - 当前AI产业利润分配严重失衡,英伟达攫取市场近九成利润,下游应用开发和模型训练企业面临天价算力成本且难以盈利,导致“头重脚轻”的利润结构,影响生态健康循环[3] - 企业生成式AI(GenAI)支出从2024年的115亿美元跃升至2025年的370亿美元,年增长约3.2倍,约占全球SaaS市场6%[3] - 过去6个月AI产业迭代速度远超去年,正处于技术周期关键拐点,核心趋势是模态融合,多模态调用量占比持续攀升,生图、生视频能力增长迅猛[3] AI应用市场增长与商业化梯队 - C端应用增长显著,2025年全球用户在ChatGPT移动应用上的支出约为24.8亿美元,较2024年的4.87亿美元同比增长408%,从推出到达到30亿美元消费者支出仅用31个月,速度快于TikTok(58个月)、Disney+(42个月)和HBO Max(46个月)[4] - 全球AI应用商业化形成清晰梯队:第一梯队由通用大模型主导,OpenAI以100亿美元年度经常性收入(ARR)位居全球第一,2023-2025年预期收入复合增长率(CAGR)达260%,其核心产品ChatGPT贡献超60%收入;Anthropic以40亿美元ARR位列第二,2024年底至2025年7月收入增长3倍,但以B端API调用为主(占比70%-75%)[5] - 国内应用处于第二梯队(ARR 1-10亿元),垂类应用(如AI编程、多模态、AI搜索)因场景明确、降本效果显著成为商业化主力[5] - 从7月到11月,超过200款AI应用面世,其中AI应用插件、PC网页端、AI原生APP占比分别为81.5%、10.7%、7.8%;应用方向以AI图像处理(24.9%)、AI专业顾问(18.5%)、AI效率办公(6.8%)、AI社交互动(5.9%)、AI文案写作(5.9%)为主[6] 中美AI应用发展与收入差距 - 在全球前50个生成式AI App中,有22个产品由中国团队开发,但仅3个主要在中国使用,中国公司如美图(贡献5个产品)和字节跳动(拥有豆包、Cici、Gauth、Hypic等)是重要参与者[8] - 字节跳动旗下产品Dola(豆包海外版)和DeepSeek分别以4700万和3900万月活跃用户(MAU)位列全球第四和第五[6] - 中美AI应用收入存在十倍乃至百倍的差距,主要原因是美国市场拥有成熟的软件付费生态,用户更愿意为闭源软件长期付费,且美国科技巨头(如OpenAI、Google)聚焦通用智能底层探索,谷歌、微软、AWS形成了从芯片、框架到云服务的全栈闭环[8] AI技术发展重点与趋势 - 行业核心变化是从“概念炒作”进入“价值兑现”,不再单纯卷模型能力,而是关注成本效率、推理能力与用户体验[9] - 具体表现为:DeepSeek以极致成本效率击穿算力与规模神话;GPT-5将“推理”从能力升级为系统能力;Gemini 3证明顶级模型竞争持续;Qwen3在开源生态中持续扩张;AIGC(图像、视频生成)从“展示能力”走向被用户大量使用[9] - 大模型成本快速下降,例如GPT-4成本从60美元/百万token降至GPT-5.1的1.25美元,国产模型GLM-4.6成本更压至0.3美元/百万token[20] AI Agent(智能体)的落地现状与挑战 - Agent落地应用的最大障碍已从成本问题转变为“质量”问题,即如何输出可靠、准确的内容[11] - 质量挑战具体指Agent的准确性、相关性、输出一致性,以及维持适切语调、遵循品牌或政策规范的能力,有三分之一的受访者视其为主要瓶颈;延迟是第二大挑战,占比20%[13] - 大型企业(万人以上)在Agent部署上领先,67%已投入生产,24%正在积极开发;百人以下小公司该比例分别为50%和36%[11] - 目前Agent应用主要限于编程和客服等高人力成本场景,降本效果显著但增收不够明显[14] AI在具体行业的落地应用与案例 - AI SaaS企业通过满足中小商家未被满足的需求实现商业化,例如筷子科技通过智能体和托管服务,以GMV抽佣方式服务预算有限的品牌商家[14] - 具体案例:广州市一家汽车美容店使用AI工具,半小时内生成100多条个性化视频,新客源在一周内同比增加50%,获客成本远低于传统模式[14] - AI落地不是全流程颠覆,而是技术与产业需求逐步校准磨合的过程,企业应聚焦“小切口、高适配、高收益”的场景[15] AI动漫(漫剧)赛道机遇与现状 - AI动漫赛道受资本市场看好,2025年10月底多家头部券商发布研报看好该赛道,视频平台(芒果、抖音、B站等)和内容公司(如阅文集团)竞相入场[16] - AI动态漫制作成本大幅下降,单分钟生成成本从纯人工时期的数万元压缩至千元以内(最低600-700元),整部作品制作成本降至5万-10万元,仅为传统动态漫的10%-30%[17] - 该赛道盈利能力显现,AI漫剧的全域经营投流投资回报率(ROI)普遍达到1.1-1.8倍[16] - 行业马太效应明显,2025年6-8月数据显示,累计播放量破千万的漫剧仅占12%,而64%的作品播放量不足100万;一部播放量破千万的付费AI漫剧净利润可达20万至30万元[19] 对普通人与创业者的启示 - 当前AI应用已到“傻瓜级应用级别”,普通人可通过提示词和内容调试使用,但成功关键在于理解业务场景而非单纯技术[16] - 对于AI动漫创业,操作流程(选择故事脚本、确认风格与分镜、生成画面、剪辑视频)已趋于简化,但核心竞争力仍在于题材新奇和故事好,需要导演与编剧思维[18][19] - 固定价格的端侧设备能运行的AI模型参数量每88天翻一番,成本降低与性能提升是必然趋势[20] - AI+的关键在于增效而不仅是降本,应选择有增长潜力的行业而非夕阳行业进行应用[20]
LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景
Founder Park· 2025-12-22 20:02
行业核心观点 - 2025年,AI Agent大规模应用的主要障碍已从成本转向输出质量,确保其输出可靠、准确是最大挑战[1] - 进入2026年,行业讨论焦点已从“是否采用Agent”全面转向“如何规模化、可靠且高效地应用”[2] Agent采用现状与趋势 - 超过一半(57.3%)的受访者已将Agent投入实际生产,另有30.4%正在开发且有明确上线计划,行业正从“概念验证”快速迈向“价值实现”阶段[4][5] - 规模越大的企业,Agent落地速度越快:万人以上大型企业中,67%已将Agent投入生产,24%正在积极开发;而百人以下小公司的比例分别为50%和36%[6] - 客户服务(26.5%)与研究及数据分析(24.4%)是目前最主流的Agent应用场景,两者合计占据所有应用场景的一半以上[10] - 在万人以上的大企业中,提升内部生产力(26.8%)反超客户服务,成为第一大应用场景[13] - 今年的应用场景分布更广,表明Agent应用正从早期领域向更多元化方向渗透[12] 应用挑战与障碍 - 输出质量(准确性、相关性、一致性、遵循规范的能力)是阻碍Agent大规模应用的最大障碍,三分之一的受访者视其为主要瓶颈[14] - 延迟(20%)是第二大挑战,尤其在客服或代码生成等实时交互场景中,响应速度直接影响用户体验[17] - 对于员工超过2000人的企业,安全问题(24.9%)的关注度超过延迟,成为仅次于质量的第二大挑战[18] - 对于万人以上企业,“幻觉”和生成内容的一致性被提及为保障质量的最大挑战,同时在上下文工程及大规模管理上下文方面也困难重重[20] - 随着模型价格下降和技术优化,成本已不再是大家最头疼的问题,行业关注点正从“省钱”转向如何让Agent运行得更好、更快[17] 技术实施与评估 - Agent执行流程的可观测性已成为行业标配:89%的企业已为其Agent实施某种形式的可观察性,其中62%拥有详细的追踪能力[21][23] - 在已有Agent投入生产的受访者中,可观测性部署比例更高:94%部署了可观察性,其中71.5%具备完整的追踪能力[23] - 超过半数(52.4%)的企业会通过测试集进行离线评估,而在线评估的采用率较低(37.3%),但后者比例正在增长[25][26] - 当Agent进入生产环境后,“不进行任何评估”的团队比例从29.5%下降至22.8%,进行在线评估的比例则上升至44.8%[28] - 在评估方法上,行业呈现混合模式:近四分之一的团队同时采用离线和在线评估,普遍依赖人机结合方法,如采用LLM-as-judge(53.3%)和人工审查(59.8%)[31][33] - 传统机器学习指标(如ROUGE和BLEU)采用率较低,因其不适合评估开放式、存在多个合规答案的Agent交互场景[34] 模型使用与开发模式 - OpenAI的GPT模型在采用率上占主导,超过三分之二的企业正在使用[36] - 超过四分之三的团队在生产或开发中会使用多种模型,倾向于根据任务复杂度、成本和延迟灵活分配任务,而非绑定单一平台[36] - 超过三分之一的组织仍在投资部署开源模型,主要出于成本优化、数据主权或行业监管合规的考虑[38] - 微调尚未成为主流:57%的组织没有进行微调,而是更依赖于提示工程和RAG技术[38] 日常使用与工具类别 - 编程类Agent是日常工作中使用最频繁的类别,如Claude Code、Cursor、GitHub Copilot等工具被广泛用于代码生成、调试和测试[40] - 研究类Agent是第二大常用类别,由ChatGPT、Claude、Gemini、Perplexity等工具驱动,用于探索新领域、总结文档及整合跨源信息[41] - 基于LangChain和LangGraph构建的自定义Agent也广受欢迎,用于QA测试、知识库搜索、工作流自动化等内部场景[42] - 仍有相当一部分受访者表示,除了聊天或编程助手,还没用过其他类型的Agent,表明“一切皆可Agent”的愿景仍处于非常早期阶段[44]
硅谷顶尖风投 a16z 2026 大构想:从 AI 到现实世界的全面重塑
36氪· 2025-12-19 15:43
文章核心观点 a16z发布的《Big Ideas 2026》报告指出,科技发展正迎来关键转折点,AI将从“数字助理”进化为“自主执行集群”,并从屏幕中“溢出”以全面重构物理世界的运行规则,这将在多个领域催生颠覆性的投资机会[1][2][31] AI基础设施与智能体 - AI正从“对话工具”向“多智能体系统”跨越,2026年将见证这一转变,企业将由多智能体系统驱动,实现运营杠杆的历史性突破[1][2][7] - AI的终极目标是让用户离开屏幕,未来AI将在后台完成90%的重复性工作,投资逻辑将从关注用户粘性转向关注自动化任务的完成质量[8] - 企业中80%的知识锁在非结构化、多模态数据中,能高效清理、验证并管理这些“暗数据”的平台将掌握企业级知识管理的主动权,这是一个千亿级赛道[8] - 当智能体触发的递归任务流呈指数级增长时,现有基础设施将不堪重负,未来的“智能体原生基建”必须支持大规模并发、极低延迟和智能路由,这将决定AI应用落地的天花板[8][9] - AI将接管网络安全中大量重复性工作,解放安全团队进行更深层次的漏洞修复和犯罪追踪[10] - 创意工具将实现跨模态整合,用户可用一段声音生成视频或用草图生成3D建模,使内容创作的边际成本趋向于零[10] - 2026年将诞生第一所完全围绕AI构建的“AI原生大学”,其课程设置和科研协作由AI实时优化[10] SaaS与企业软件范式转移 - 企业软件正经历从“被动记录”到“主动推理”的范式转移,未来的企业软件将是“主动的智能工作流引擎”,能预测需求并协调端到端执行,取代仅提供存储功能的过时软件[1][11][13] - 在医疗、法律、建筑等垂直行业,AI将成为协调买卖双方、顾问与供应商的“超级节点”,打破行业围墙,大幅提升行业整体周转效率[14] - 个性化服务将实现从“为所有人优化”到“为每个人定制”的飞跃,AI将实时根据个人偏好量身定制教育路径、健康方案等独特体验[1][14] 物理世界的复兴与制造业 - 科技正在“溢出屏幕”,“比特”开始全面接管“原子”,软件和AI正在让美国制造业机器重新运转,迎来“电气化复兴”的黄金时代[1][2][15][21] - 未来企业将以“工厂思维”应对能源、采矿、建筑挑战,通过模块化部署和AI自动审批流程,使复杂流程像流水线一样高效,未来能像生产手机一样大规模生产核反应堆,像组装家具一样快速建造住房[21] - 电气化、材料科学与AI的进步正在融合,形成“电子工业堆栈”,使软件能够真正控制物理世界,从矿物精炼、电池储能到电力电子设备控制都由软件协调[22][23] - 掌握“电气化产业链”的国家和企业,将决定未来工业和军事技术的制高点[24] 生物健康与虚拟交互 - 2026年,AI将把“健康的青年用户”推向医疗科技的核心,通过长期、低成本的实时监测和预防性护理,帮助用户延缓进入重症阶段,这是一个极具潜力的长效订阅商业模式[25] - 在虚拟世界中,用户只需一段文字描述,AI就能实时生成完整的3D交互环境,这些“生成式多元宇宙”不仅用于娱乐,更是训练自动驾驶和机器人的重要虚拟靶场[26] 加密货币与金融基础设施 - 加密货币将化身为互联网的基础结算层,稳定币与RWA将重构金融底层[1] - 隐私将是未来区块链竞争的关键要素,具备隐私功能的区块链能够形成强大的网络效应,成为加密货币领域的赢家[27] - 越来越多的传统资产将被代币化上链,未来的代币化产品应充分利用加密技术的原生特性,例如永续期货等创新金融工具[28] - 稳定币正在成为全球支付的基础设施,2026年,新的支付方式将更加普及,稳定币将从一种金融工具转变为互联网的基础结算层[29] - 未来的即时通讯将采用去中心化协议,取代对私有服务器的依赖,从而实现更高的隐私和安全性[30] 投资格局与趋势总结 - AI的护城河正在下移,核心价值向“智能体协调能力”和“物理世界执行力”转移[31] - 制造业、电气化、能源基建等“硬科技”领域正在被AI重新赋能,将诞生新的万亿级巨头[32] - 能够为每个人提供定制化服务的平台,将拥有极高的获客壁垒和提价空间[33] - 投资者应抓住足以改变世界运行轨迹的“大构想”,重仓那些敢于重塑底层架构的颠覆者[33]