AI Agent
搜索文档
追责云业务造假和经济舞弊!华为云CEO被连降三等
财联社· 2025-10-18 17:01
公司管理层变动与内部治理 - 华为云计算业务多位管理层因云业务造假与经济舞弊问题被问责和处分 [1] - 华为云计算BG CEO张平安作为业务负责人被连降三等 工资向下调整至新职级最大值 并予以严重警告 [2] - 华为云服务产品部部长张宇昕 云计算全球marketing与销售服务部总裁石冀琳 云计算全球生态部部长康宁因管理不到位被连降两等 [2] - 公司对造假问题持零容忍态度 此次处罚在内部看来并不意外 [3] - 针对云计算业务问题的问责自上而下 除管理层外还有多人被处罚 [4] 公司业务战略与组织调整 - 华为云CEO张平安于8月22日宣布对云BU下层组织进行大范围撤销与合并 重点围绕产品部 公有云服务部及研发部等核心团队 涉及数十个下层部门与组织 [5] - 此次大规模组织优化调整或波及上千人 [5] - 调整后华为云将聚焦3+2+1业务 包括通算 智算 存储 AI PaaS 数据库以及安全业务 [6] - 华为云回应称通过软硬协同和架构创新为客户打造云服务 同时将更多资源投入到AI产业和算力产业 [6] - 公司在全联接大会上分享了华为云在AI云服务 大模型 具身智能 AI Agent等领域的技术创新与落地实践 [7] 行业竞争格局与市场表现 - 在云服务市场 阿里云处于领先地位 华为云位于第二 但市场份额与阿里云存在不小差距 [8] - 2025年第一季度中国大陆云基础设施服务支出达到116亿美元 同比增长16% [8] - AI相关需求已成为推动企业向云端迁移的主要动力 [8] - 2025年第一季度阿里云市场份额达33% 同比增长15% 其AI相关工作负载已连续七个季度实现三位数增长 [8] - 同期华为云市场份额为18% 营收同比增长达到18% [8]
聊聊 AI Agent 到底有多大创新?
自动驾驶之心· 2025-10-18 12:00
AI Agent技术当前面临的挑战 - 当前AI Agent在用户体验上与传统task bot相比并无显著提升,甚至更差[1] - Planning阶段耗时巨大,工具增多后模型准确率下降,使用旗舰模型进一步增加延时[2] - Planning质量不高,模型构建的复杂工作流可用率远低于人类水平,简单工作流使用判别式小模型性能更好[2] - Reflection策略容易陷入自我内耗和死循环[3] Planning速度问题的本质与解决方案 - 核心问题是工具发现和参数对齐成本被低估,从编译时确定的工具编排变为运行时动态选择,搜索空间随工具数量指数级膨胀[5] - 解决方案包括工具层缩小范围分层治理,先用意图分类器将请求路由到具体域,每个域只暴露5-10个核心工具[5] - 将串行改为DAG并行执行,LLMCompiler支持将调用计划编译成有向无环图,并行化可使链路耗时缩短20%[6] - 在项目开始节点增加路由策略,简单任务路由给SLM或专用执行器,复杂规划才使用强推理模型[6] Planning质量问题的本质与提升方案 - 本质原因是模型生成的文字描述计划缺乏可执行性和全局约束,传统workflow有明确的分支条件和异常处理[8] - HiPlan方案将计划拆分为里程碑和局部提示两层,高层管战略目标,低层负责战术细节,里程碑可离线积累复用[8] - Routine实践提供结构化计划框架,强制模型输出符合语法的计划,可将企业场景工具调用准确率提升平均20多个百分点[10] - 搜索式规划如LATS引入MCTS,展开多条路径用Verifier评分选最优,HyperTree和Graph-of-Thoughts支持非树形图结构[12] - 基于强化学习的多轮训练可有效提升agent长程任务性能,例如RAGEN、LMRL-Gym等研究实现明显指标提升[14] Reflection死循环问题的根源与修复方法 - 根本原因是缺少细粒度可计算信号和明确停机条件,模型反思仅靠主观判断易强化错误假设[15] - UFO研究使用最简单的一元反馈如Try again进行多轮RL,不需要详细错误诊断即可学会自我改进[17] - Tool-Reflection-Bench将错误修复过程变为明确可控动作,模型学会基于证据诊断错误并提出可执行后续调用[18] - 工程层面可设置max_rounds硬性上限、no-progress-k连续无改进则停、state-hash去重、cost-budget预算终止等机制[20] AI Agent技术发展趋势与价值 - Agent现阶段问题需结合强化学习,构建多轮交互特定环境,让模型学到稳定推理执行能力[20] - 端到端RL将整个Agent视为策略网络,直接从环境反馈学习,涌现规划、工具使用、反思等能力,是未来技术趋势[20] - AI Agent是LLM在现实场景业务落地最有价值的技术方向,Agent能力正逐步内化为模型能力[21] - RL契合Agent在垂直领域现实环境的问题模拟,工具高度封装化和运行环境可迁移性使sim2real难题不再成为掣肘[21] - 通过RL训练的Agent模型具备很高实用价值且价值持续扩大,同时降低了应用下限并提升了能力上限[21]
通用型产品增长停滞,垂直赛道成市场新解法丨季度AI 100数据解读
量子位· 2025-10-18 10:07
文章核心观点 - AI产品竞争格局呈现多元化发展,互联网巨头凭借全产品矩阵形成生态优势,而初创公司则深耕细分人群以优化体验[2] - AI产品用户规模和活跃度的增长引擎正从通用头部产品转向长尾高细分产品,新兴赛道和Agent产品表现突出[6] - AI产品形态正从工具向集成化工作台和具备执行能力的桌面端Agent演进,Web端与桌面端定位逐步分化[28][31] APP端AI产品现状 - Web端AI产品总访问量和MAU增长停滞,数据持平在6亿和1.3亿人次,头部产品数据出现轻微下滑[6] - 用户增长引擎转变,长尾高细分产品成为增长主力,AI健康等新兴赛道表现瞩目[6] - 综合化办公Agent和垂直赛道Agent用户增长亮眼,显示Agent产品价值得到验证[6] - 头部集中化态势减弱,中腰部产品下载量和日活提升明显,TOP 5产品市场占有率从超60%降至50%以内[14][15] - 智能助手类产品累计下载超5亿,日活超8100万,在APP端占比约33%和32%,但比重较第二季度下降[16] - AI效率办公类产品累计下载量接近5亿,领先于AI创作(近2.7亿)和AI文娱生活(近2.6亿)赛道[17] - AI健康细分赛道增长迅速,蚂蚁AQ和字节小荷AI医生发布两个月累计下载分别达近1400万和近200万[17] APP端用户规模TOP 10 - 夸克以约2.51亿累计下载量位居第一,豆包以约2.33亿紧随其后[7] - 用户规模数据量级在1000万以上的产品共有23款[7] APP端用户新增TOP 10 - 2025年9月APP端AI产品总新增下载超1.66亿,相比6月的1.3亿上涨超27%[9] - 豆包和夸克是9月唯二新增下载量超两千万的产品,分别达约2700万和约2300万[9][10] - 新增千万级产品共4款,百万级产品共24个,相比6月(16款)增长明显[9][10] APP端用户活跃TOP 10 - 2025年9月平均每天有近3亿人次使用AI APP,数据相比6月增长近50%[12] - WPS以约6100万DAU位居第一,共8款产品DAU超千万[12] - DAU在百万级以上的产品从6月的15个增加至20个,腰部以上产品是活跃用户增长主要贡献者[12][13] Web端AI产品现状 - 9月Web端总访问量超6亿,较6月的5.7亿有所增长;总活跃用户数约1.24亿,与6月基本持平[27] - 头部产品访问量和活跃用户有所下滑,TOP 10访问量门槛从1900万降至1700万,月活TOP 10门槛从370万降至340万[27] - 流量被AI Agent类产品分走,该品类有7款产品入围榜单,对多个效率类细分赛道形成挤压[32][33] Web端使用规模TOP 10 - 访问量千万级的Web端AI产品维持在10款,DeepSeek、豆包和夸克访问量位列前三,在整体中占比达47%[18] - DeepSeek以约1.15亿总访问量位居第一,豆包约8500万,夸克约8200万[18] - 豆包9月访问量比6月增长约2500万,百度AI搜索9月访问量相比6月增长超1800万,涨幅达74%[19][20] Web端用户活跃TOP 10 - MAU百万级产品共有19个,百度AI搜索月活数据连续两月显著增长,稳定在千万级梯队[22] - 夸克以约1900万独立访客数位居第一,豆包Web端月活用户从6月约820万增长至9月突破1000万[22][23] Web端用户粘性TOP 10 - 用户粘性TOP 10被AI办公效率应用和AI智能助手应用垄断,莫高设计以9.5次人均访问次数领先[25] - 人均访问次数在5次以上的产品共有23款[26] AI产品形态演进趋势 - 头部产品从"工具"向沉浸式"工作台"转变,进行系统深度集成[28] - 随着Agent能力植入,桌面端形态更符合国内用户习惯,代表有Kimi的OK Computer模式和阶跃星辰的桌面伙伴小跃[29][30] - 未来桌面端基于Agent侧重执行,Web端则侧重相对简单的信息再处理[31] - Agent产品能够端到端交付成果,不仅挤占Web端头部产品空间,也对多个效率类细分赛道形成挤压[33]
从概念热到落地难:Agent 元年的真实进程
搜狐财经· 2025-10-17 21:03
Agent行业趋势与竞争焦点 - 大型科技公司和创业公司均在积极布局Agent产品,加速在企业级场景中落地,渗透金融服务、制造业和教育等行业 [2] - 行业竞争焦点从模型参数转向平台工程能力和企业落地能力,模型层趋于同质化 [4] - 工作流编排、工具集成、性能评估和安全治理等工程环节成为AI生态的关键战场 [4] 企业落地现状与挑战 - 2025年无论大企业还是SMB对Agent的热情高涨,但行业落地尚未完美 [7] - 模型能力与多样化业务场景的任务需求匹配不足,现有模型泛化能力有限 [7] - Agent的多轮调用和工具链执行导致算力开销高昂,企业面临成本与性能的平衡难题 [7] - 系统集成复杂度高,缺乏统一的协议标准与可靠的调用机制,开发成本和维护难度激增 [7] - 安全性与可靠性是企业级落地的关键门槛,需要稳定、可控且合规的基础设施支持 [7] - 企业高层战略认知是最大障碍,许多负责人仅将Agent视为工具自动化,而非业务重构与组织升级的契机 [9] 平台解决方案与能力升级(以百度千帆为例) - 百度千帆将AppBuilder与ModelBuilder融合升级,形成集大模型、工具组件与智能体开发于一体的企业级工具链 [5] - 平台定位从云服务平台扩展为面向企业的大模型与Agent一体化开发平台 [5] - 推出灵活的Agent编排架构,支持自主规划、工作流编排与多智能体协同,全面提升性能、兼容性与稳定性 [12] - 构建开放的工具与MCP生态,上线百度AI搜索、百度百科等自研组件,并引入第三方生态工具 [14] - 平台汇集超过150款SOTA模型,覆盖视觉、视频、语音等多模态场景 [14] - 创新推出主动Cache模式,通过分布式KVCache技术可降低高达80%的推理成本,优化Agent经济可行性 [14] - 提供端到端的可观测性能力,具备多地容灾、秒级故障切换与多层次安全防护机制,确保企业级业务高可用与高安全 [15] 未来发展方向与展望 - 未来Agent将更深融入企业业务流程,基础是模型能力的持续进化,包括多模态理解、思考模型和更强推理能力 [15] - Context Engineering是重要方向,通过精准线索提取与上下文重组,使模型能触达专家经验与业务知识 [16] - Agent的记忆能力将成为新增长点,需平衡记忆范围与成本,服务于业务决策与交互体验 [16] - 未来将出现更多来自不同行业和场景的Agent,形成规模化应用,平台需不断完善工具、接口与生态以支持创新 [16] - 模型能力、平台生态、市场需求与政策环境正逐渐进入成本与效益匹配的平衡点,未来将看到成千上万的垂类Agent深度嵌入各行业 [17]
华为云CEO张平安连降三等,多名云业务高管被问责
南方都市报· 2025-10-17 17:26
人事变动与内部管理 - 华为云计算CEO张平安因云业务造假与经济舞弊问题被连降三等 工资向下调整至新职级的最大值 并予以严重警告 [1] - 华为云服务产品部部长张宇昕 云计算全球marketing与销售服务部总裁石冀琳 云计算全球生态部部长康宁因管理不到位被连降两等 [1] - 公司近期严查云业务市场收入与产品竞争力等问题 [4] 公司业务与战略调整 - 2024年华为云计算业务实现收入38523亿元 同比增长85% [5] - 2024年8月华为云对产品部 公有云服务部及研发部等核心部门进行大范围撤销与合并 涉及数十个下层组织 或波及上千人 [4] - 调整后华为云将聚焦"3+2+1"业务 "3"为通算 智算 存储 "2"为AIPaaS 数据库 "1"为安全 [4] 行业竞争与市场表现 - 2024年中国AI公有云服务市场规模1959亿元 百度智能云与阿里云市场份额并列第一 均为246% 其次是腾讯云和华为云 [5] - 华为云通过软硬协同 架构创新 持续投入AI和算力产业 [5]
2025跨境电商“卖水人”暗战:33起融资背后,谁在收割行业新红利?
36氪· 2025-10-16 18:03
文章核心观点 - 跨境电商生态服务商在2025年成为资本密集押注的新宠,其角色类似于历史上淘金热中的“卖水人”,为出海企业提供运营、营销、物流、支付及客服等支持 [1] - 2025年前三季度全球跨境电商生态服务领域发生至少33起融资事件,数量同比大增74% [1] - 资本市场对跨境电商生态服务领域保持高涨投资热情,AI技术驱动的新型服务商和传统业务类型的老牌服务商均获得资金支持 [1] 融资活动总体情况 - 2025年前三季度共发生至少33起投融资活动,涉及32家出海企业及两次IPO事件 [2] - 融资时间分布:第一季度7起、第二季度9起、第三季度17起,整体呈波动上升趋势,8月为高峰单月发生7起融资事件 [8] - 融资规模以百万/千万级和亿级为主,其中千万级融资14起,亿级融资11起,头部企业聚拢大量资金 [10] - 非IPO融资项目中规模前十的企业融资额均突破1亿元人民币,最大单笔融资为空中云汇F轮3亿美元 [10] 融资轮次分布 - 成长期企业是获得融资的主要群体,Pre-A轮至C轮融资事件占比超50% [12] - 具体轮次分布:种子轮/天使轮5起、Pre-A轮/A轮/A+轮10起、B轮/B+轮4起、C轮/C+轮3起、更高轮次4起、战略融资4起、IPO流程中1起、IPO成功上市2起 [12] - 初创期企业获投较少仅5家,代表企业为AI Agent服务商斗兽场(Lynx AI) [14] - 栢藤(Pattern)作为极少数登陆美股的跨境电商生态服务商,在美国纳斯达克完成上市 [15] 细分赛道资本偏好 - 营销服务商融资11起领跑各赛道,早期轮次(A轮以下)占比接近半数 [16][18] - 物流服务商融资10起,数量仅次于营销服务商 [16][20] - 运营与金融支付服务商构成第二梯队,金融支付领域七家企业斩获融资并吸纳超26亿元资金 [16][24] - 客服、研发及平台类企业相对遇冷 [16] 营销服务商分析 - 营销服务商崛起与生成式AI技术革新关系紧密,业务内核与AI技术高度契合 [18] - 主要分为两大类型:自动化广告营销系统(极睿科技、Instant、Sandwich Lab)和类SaaS平台(栢藤、船长BI) [18] - AI数字人服务商(硅基智能)和跨境直播综合解决方案服务方(渡河之众)也在融资阵营中占据一席之地 [19] 物流服务商分析 - 获投的十家物流企业遍及履约链条各环节,业务类型高度多元化 [22] - 包括直发物流(顺友物流)、端到端配送(Maple Supply Chain)、第三方海外仓(泛鼎国际)、中程/尾程物流(Warp、Oway、UniUni)及仓储自动化(极智嘉) [22] - 关税战加剧全球商贸物流动荡,为具备业务韧性和技术实力的物流服务商创造发展窗口 [21] 金融支付服务商分析 - 空中云汇(Airwallex)年化收入超7.2亿美元同比暴增90%,全球年化交易支付额破1300亿美元 [25] - 增长动能来自AI技术在风控、运营环节的深度融合及从服务中国出海企业到赋能全球本土企业的战略转型 [25] - 新兴服务商包括提供嵌入式跨境支付解决方案的Send Payments、稳定币B2B支付服务的鲲KUN、跨境加密支付的ApexPay等 [25] 行业新兴趋势与技术 - AI Agent成为热门关键词,多家服务商以其为核心定位,业务集中于内容营销与市场洞察 [26] - 数里行间(Shulex)通过AI Agent提供自动化客服和VOC洞察服务,Sandwich Lab的“Lexi”可全流程托管Facebook等平台广告投放 [26] - 物流领域出现“灵活履约”范式,代表企业Oway、Warp、UniUni、ShipBob具备资源高度流动化、决策高度即时化及能力高度可变性特征 [27] - 稳定币支付在跨境领域热度飙升,鲲KUN、ApexPay、Obita等开始构建适用于电商场景的稳定币支付系统 [29][31] - Shopify与Newegg已支持稳定币支付,亚马逊和沃尔玛正在研究发行自己的稳定币 [30]
大模型方向适合去工作还是读博?
具身智能之心· 2025-10-16 08:03
文章核心观点 - 文章探讨了大模型领域从业者面临的职业发展选择问题 即继续深造读博还是参与AI Agent创业潮 [1] - 决策需基于个人是否具备扎实的大模型基础以及是否适合扮演“开拓者”的研究角色 [1][2] - 大模型之心Tech知识星球被定位为一个综合性的学习与交流平台 旨在为不同阶段的从业者提供系统化支持 [2][4] 大模型行业现状与人才需求 - 大模型技术范围广泛 涉及生成、多模态、微调、强化学习、基准测试及多个下游应用领域 [1] - 通用大模型研发存在高壁垒 主要由顶级公司主导 [1] - 行业存在导师半路出家、学生基础不扎实的现象 凸显了系统性学习的重要性 [1][2] 大模型之心Tech知识星球资源 - 社区形式为视频、图文、学习路线、问答与求职交流的综合体 [2] - 已邀请40余位来自国内外顶尖高校(如清华、北大、上交、港科大等)和头部公司(如阿里、百度、字节、月之暗面等)的嘉宾 [4][66] - 提供大模型全栈学习路线图 覆盖RAG、AI Agent、多模态大模型等核心方向 [4] 技术路线覆盖详情 - RAG技术路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [9][10][16][18][20][22][24][25] - AI Agent技术路线包括前沿综述、评测、强化学习、多模态Agent、通讯协议等7个细分方向 [26][27][29][31][33][35][36][38][40][42] - 多模态大模型训练涵盖MLLM、VLM、微调、RLHF、MoE等9个技术模块 [44][47][49][51][53][54][55][56][58] - 大模型量化、部署及推理被列为独立的技术板块 [60][61][62][63] 社区附加价值 - 提供大模型学术进展与工业应用的最新信息 [7] - 具备工作岗位推荐功能 可第一时间对接企业需求 [7][68] - 计划通过行业大佬直播分享和独家岗位招聘信息进一步赋能社区成员 [64][65][67][68]
该治好AI的健忘症了
虎嗅APP· 2025-10-15 17:50
AI记忆技术的重要性 - AI大模型存在类似顺行性失忆症的问题,无法持久保存和利用新获取的信息[6] - 记忆能力是实现AI Agent多步骤任务执行的关键前提,缺乏记忆的AI只能停留在聊天机器人阶段[7][8] - 随着任务复杂度增加,AI需要记住更多用户信息,导致算力成本呈平方甚至指数级增长,早期GPT-3扩展至32K token时算力可能暴增256倍[9] - 记忆技术被视为实现AGI(通用人工智能)的核心基础,没有记忆就无法实现真正的智能[9] 行业竞争格局 - 2022年ChatGPT引领"百模大战"后,2024年行业进入"百Agent大战"阶段,记忆成为技术竞争核心战场[13][14] - OpenAI 2024年亏损高达50亿美元,预计2025年亏损将攀升至140亿美元,迫使大厂重视商业化与变现[13] - 2024-2025年多家龙头企业布局记忆功能:苹果2024年6月推出Apple Intelligence,OpenAI 2025年2月在ChatGPT上线记忆功能,OPPO 2025年4月推出小布记忆,Anthropic 2025年8月为Claude添加长期记忆能力[15][16][17] - 参赛者从传统互联网厂商扩展至终端设备制造商,如苹果和OPPO,手机作为高频计算终端具备数据获取优势[19] 技术路线对比 - 苹果采用以端侧记忆为核心的"个人情境"模式,所有记忆数据存储于端侧以确保安全,但受限于终端硬件性能[21][22] - OPPO推行端云协同架构的"小布记忆"方案,智能分配计算任务:端侧处理简单快速任务,云端处理复杂算力需求[23] - 端云协同机制实现了性能、隐私与功耗三者平衡,破解业界"不可能三角"难题,使AI记忆不受手机内存和算力限制[23] - OPPO方案支持长期记忆和打破信息孤岛两大核心目标,通过一键问屏能力打通应用间壁垒,汇聚各平台记忆片段[30][31] 实际应用价值 - 单纯的AI功能演示(如点2000杯咖啡)缺乏实际价值,必须基于长期用户习惯理解才能提供个性化服务[25] - AI需要纵向掌握用户不同时间段的口味变化,横向理解跨地域、跨平台的行为偏好,才能提供精准推荐[25] - 小布记忆系统通过持续积累用户意图数据,逐步解析真实需求,实现基于上下文的任务执行[26] - 当AI具备长期记忆后,能结合用户历史行为(如通勤习惯、饮食偏好)提供针对性服务,实现"每天懂你多一些"[27] 技术突破与认可 - OPPO小布记忆成为吉尼斯首个认证的"AI记忆大师",一键闪记功能成功挑战吉尼斯世界纪录[32] - 系统级AI功能可自动转化屏幕内容为待记录信息,配备专属物理按键支持一键闪记,操作直观高效[31] - 记忆技术不仅能破解信息孤岛问题,还能让AI在日常生活中真正理解用户,被认为是"得记忆者得天下"的关键[35]
中美AI Agent争霸战:谁将主导下一代智能服务?
远川研究所· 2025-10-15 17:07
Palantir股价表现与业务驱动 - 2025年美股科技股表现分化,英伟达市值单季蒸发4000亿美元,而Palantir股价年内累计上涨超过130%,跻身美股科技股市值前十[2] - 公司连续八个季度营收增长,核心驱动力是人工智能平台(AIP)的稳定增收,该平台被视为AI Agent路线的先行验证[2] - AIP本质是“AI工具箱”,企业可点对点嵌入工作流,通过部署不同“工种”的Agent来提升实际效能[2] AI Agent成为中美科技竞争新焦点 - 谷歌发布A2A开放协议旨在统一Agent间沟通语言,OpenAI发布Agent构建白皮书,显示出硅谷通过“立法”占据生态位的策略[4] - 中国科技公司路径不同,侧重于通过密集发布产品加速场景落地,国内仅Agent开发平台就至少有126个[5] - 行业焦虑源于MIT报告指出,其跟踪的300多个AI项目中,95%未产生财务回报,剩余5%回报仅几百万美元[5] AI Agent的价值与落地挑战 - AI Agent被视为突破当前GenAI应用三大缺陷(无法保留反馈、无法适应场景、无法改进迭代)的关键[8] - 其本质是通过嵌入持久记忆和迭代学习系统,使AI从答疑解惑进阶到能主动规划解决问题,成为可分担工作的“同事”[9] - 行业研讨会指出95%的AI Agent部署在生产环境中会失败,主因是上下文工程、安全性、记忆设计等支撑体系未到位[12] - 成功落地需同时具备技术(懂模型、懂数据)与服务(懂行业、懂需求的定制化)两大条件,同时掌握者屈指可数[12] 阿里瓴羊的AI Agent战略布局 - 瓴羊以“有的放矢”策略切入市场,首批发布“超级电商客服Agent”等产品,瞄准人力密集型场景[14] - 通过将客服、电销流程细化,精准锁定能通过Agent解放人力、提升效能的痛点[14] - 分批次发布数据分析Agent和超级营销Agent后,最终整合推出企业级AI智能体服务平台AgentOne,整合超过20种即用型Agent,覆盖六大行业四大场景[16] - 复星旅文利用AgentOne平台构建AI G O度假智能体,在一个对话窗口集中处理行程规划、客房预订等碎片化服务需求[16] 企业级Agent的成功要素与护城河 - 企业级Agent成功公式为“大模型 x 好数据 x 强场景”,任何一项薄弱都会导致效果指数级衰减[18] - 瓴羊的底气在于“大模型”背靠阿里模型技术布局,“好数据”与“强场景”源于其多年业务实践[19] - 瓴羊常被对标Palantir,共通点在于“数据”和“场景落地”能力,分别对应瓴羊的数据中台经验、BDSA岗位与Palantir的“数据本体论”、FDE前线部署工程师[21][23] - 关键分野在于瓴羊的数据治理法则已在阿里生态中经过万亿级交易淬炼验证,无需“从头立法”,可经定制化快速赋能企业[24][25] - 最终目标是构建允许价值自主涌现的生态系统,使AI Agent成为驱动企业持续蜕变的自主进化引擎[25][27]
几乎都在挂羊头卖狗肉,AI Agent的泡沫现在到底有多大?
36氪· 2025-10-15 10:03
AI Agent行业现状与挑战 - 2025年AI Agent创业领域呈现热闹但留存率低的局面,用户试用一次即离开的比例居高不下[1] - 通用型Agent产品面临叙事透支风险,Demo演示效果与落地实际表现存在显著差距[1] - 行业内出现"Agent洗白"现象,大量传统RPA产品被重新包装为AI Agent,Gartner测试的数千款产品中仅约130款真正符合标准[7][8] Manus案例研究 - Manus公司将总部从国内搬迁到新加坡,随后推出Wide Research产品,并可能因安全审查问题被强制撤销融资[3] - Wide Research被行业专家评价为缺乏竞争力,存在定价昂贵、性能未经验证、缺乏场景壁垒等问题[4] - 该产品消耗大量计算资源和调用额度,但未解决专业数据、专属工具链、行业认证等核心问题[4] - 专家认为Manus走资本路线而非产品路线,通过营销推高市场知名度获取融资[5] 技术瓶颈与限制 - 底层大模型的幻觉问题无法从理论上完全消除,成为Agent产品的根本性限制[16] - 上下文长度存在硬性天花板,厂商宣称的数值水分很大,实际处理千行代码时就开始丢失信息[19][20] - 多智能体扩展面临显著限制,双智能体已能覆盖80%企业场景,更多智能体会增加复杂度且收益成本不匹配[18][19] - 基础模型的智能上限制约Agent发展,GPT-5的发布显示单模型Scaling Law几乎失效[22][23] 产品缺陷与用户体验 - 90%的ToC Agent用户使用一次即离开,产品体验不如直接使用APP[10] - ToB产品必须比现有软件更简单、准确、方便,但当前Agent往往需要更多交互步骤才能完成简单任务[10] - 高信任要求与低可靠性之间存在巨大鸿沟,用户可容忍聊天机器人错误但不能容忍关键任务失误[10] - 企业用户关注审计合规需求,但多数Agent缺乏生产过程可追溯、可解释的能力[5][11] 行业生态与市场环境 - 国内ToB SaaS基础薄弱,软件生态割裂,企业自研系统接口差异大,导致Agent标准化和复制性差[26][27][28] - 国外市场更倾向于使用成熟SaaS产品,接口通用,Agent集成成本相对较低[27] - 国内数据壁垒高,金融、医疗等行业数据获取困难,合规审核严格,制约垂直Agent发展[29][30] - 创业公司面临大模型厂商能力下沉的挤压,工具层竞争优势脆弱[24][25] 可行发展路径 - 垂直领域Agent比通用Agent更具可行性,应优先在原有赛道深耕,逐步培育生态[13][14] - 未来模式可能是"Agent + RAG + 传统workflow"组合,在保证确定性前提下利用大模型优势[41] - ToB场景中Data Agent、跨系统任务编排、高可信度知识问答是明确优先方向[43][44] - 创业公司应从长尾场景入手,解决独特痛点,形成用户粘性和技术壁垒[46] 未来展望 - Agent泡沫是新技术发展的必然阶段,行业需要5-10年时间从专业Agent发展到入口级Agent[47] - 真正的胜利者属于那些能将Agent能力与业务深度融合的专业软件公司,而非通用平台[47] - 当前阶段应关注在特定行业中解决高价值、长期未被解决的难题,提供比现有方案好2-10倍的解法[47]