Agent
搜索文档
百亿砸向Scale AI,数十亿买Manus,Meta慌不择路
36氪· 2025-12-30 11:24
公司事件:Meta收购Manus(蝴蝶效应) - 初创公司Manus(蝴蝶效应)正式加入Meta,收购金额高达数十亿美元,是Meta自成立以来的第三大收购,仅次于WhatsApp和Scale AI [1] - 收购谈判在极短时间内完成,前后不过十余天,令天使投资人感到震惊 [8] - Manus在年初因AI智能体“Manus”一夜爆红,投后估值从8500万美元暴涨至5亿美元,但随后因资金和人才问题,于7月将总部撤出中国,团队从120人裁至40余人,年底被Meta收购后估值实现翻番 [3][5] 行业趋势:AI Agent发展与巨头竞争 - 2025年被业内人士普遍视为“Agent元年”,微软、亚马逊、谷歌等巨头均推出了各自的AI智能体(Agent)核心产品或解决方案 [5] - 硅谷AI人才争夺战已到白热化程度,OpenAI去年的股权激励支出达44亿美元,占其营收的119% [8] - Meta为抢夺顶级AI人才,曾为顶级人才开出四年总额高达3亿美元的薪酬方案,并大规模从OpenAI和谷歌DeepMind挖角,引发行业震动 [8][23] 公司战略:Meta的AI战略转向与重组 - Meta的AI战略发生180度大转弯,从长期坚持开源转向闭源,并计划于2026年春季发布一款可能闭源的代号为“Avocado”的新模型 [23] - 为纠偏,Meta在5个月内对AI部门进行了4次大规模重组:5月底拆分为AI产品团队和AGI基础团队;6月投资Scale AI并启动“超级智能团队”;7月成立MSL团队进行整合;8月将MSL分拆为4个小组;10月AI部门裁员约600人,基础研究部门FAIR被边缘化 [19][22] - 原FAIR实验室首席科学家杨立昆因学院派理念与商业变现目标不和而被边缘化,需向28岁的Scale AI创始人汪韬汇报 [13][22] 公司产品:Llama模型的兴衰与挑战 - Meta早期通过开源Llama系列模型建立声望,Llama 3的450B版本在能力上逼近闭源模型 [14][15] - 2025年,来自中国的开源模型DeepSeek V3在能力和成本上对Meta构成巨大挑战,导致内部恐慌,并使后续发布的Llama 4在推理能力上被指不及预期 [16][17] - Llama 4的滑铁卢被视为Meta布局AI 12年来的重大挫折,宣告其阶段性失败 [18] 公司运营:Meta的财务影响与市场地位 - 扎克伯格暗示明年AI支出可能超过1000亿美元,Meta作为大金主对AI市场供需有巨大影响力 [24] - Meta计划2027年斥资数十亿美元采购谷歌TPU芯片的消息,引发了谷歌市值单月增长约5300亿美元、英伟达股价下挫蒸发6200亿美元的万亿级别市值波动 [24] - 在传统社交广告业务上,Meta面临TikTok的强劲竞争,TikTok全球月活用户突破20.5亿,美国用户近32%的社交媒体时间花在TikTok上 [25] 公司业务:元宇宙(现实实验室)的困境 - 负责元宇宙研发的“现实实验室”部门在2021年至2024年累计亏损超过400亿美元,2025年亏损持续,且其营收贡献率从未超过公司总营收的2% [34][35] - 2025年前三季度,现实实验室营收为12.52亿美元,低于2022年同期水平 [35] - 尽管Meta在VR头显市场占据71%的份额,但整体市场规模很小,2025年第二季度全球VR出货量仅71万台,推算年销量规模约400万台 [32][33] - 原定2026年下半年推出的混合实境眼镜“Phoenix”被推迟至2027年上半年,同时公司宣布将对元宇宙部门进行最高30%的预算削减 [40][42]
方正富邦基金李朝昱:部分高景气科技板块仍具结构性机会
证券日报网· 2025-12-27 11:16
核心观点 - 展望2026年,科技相关的投资有望继续成为全球经济增长的主要引擎,将拉动产业链上下游供需格局变化并创造新的需求 [1] 2026年科技投资展望 - 在全球AI产业持续快速发展的背景下,部分高景气科技板块仍具结构性机会 [1] - 算力基础设施虽经历数年高强度资本开支,但随着大模型渗透率提升,算力需求依然旺盛,推动存储、光通信等技术迭代,并拉动电力、上游原材料等需求 [1] - 虚拟AI与物理世界的链接交互通过具身智能成为可能,世界模型、端到端算法及灵巧手传感器等技术推陈出新,使人形机器人商业化进程大大加快 [1] - Agent的发展催生新的应用场景持续涌现,AI或正从投入转向应用产出的奇点 [1] 重点关注的投资方向 - 综合对比产业链发展周期及未来市场空间容量,未来将重点关注人形机器人及相关产业链、AI应用、算力、储能、上游原材料等方向 [1]
方正富邦基金李朝昱:高景气科技板块投资机会仍值得把握
新浪财经· 2025-12-26 17:15
核心观点 - 方正富邦基金认为,在2026年“十五五”开局之年,中美AI加速发展将驱动科技投资成为全球主要增长引擎,宏观层面的核心变化是新老动能进一步转换 [1][4] - 在AI科技产业持续快速发展背景下,应把握高景气细分领域的结构性机会,重点关注人形机器人及其相关产业链、AI应用、算力、储能、上游原材料等方向 [2][5] - 从资金面看,国内居民和机构资产有望持续增配权益市场,海外美联储降息周期有望改善全球流动性,共同为市场带来增量资金 [3][5][6] 宏观与行业展望 - 科技相关的投资有望继续成为全球经济最主要的增长引擎,将拉动产业链上下游供需变化并创造新需求 [1][4] - 新老动能进一步转换是宏观层面最值得关注的核心变化 [1][4] - 全球AI科技产业持续快速发展,部分高景气细分领域存在结构性机会 [2][5] AI与科技产业链投资方向 - 算力基础设施:尽管经历了数年高强度资本开支,但大模型渗透率提升及推理侧持续推进,仍带来对算力的源源不断需求 [2][5] - 技术迭代:算力需求推动AI芯片、存储、光通信等技术不断迭代创新,并拉动了电力、上游原材料等需求 [2][5] - AI应用与具身智能:模型泛化智能提升为AI应用创造条件,具身智能成为虚拟AI与物理世界链接交互的纽带 [2][5] - 人形机器人商业化:世界模型、端到端算法、灵巧手传感器等技术推陈出新,使人形机器人商业化进程大大加快 [2][5] - AI应用奇点:Agent发展催生新的应用场景逐步涌现,AI从投入转向应用产出的奇点可能正在到来 [2][5] - 重点关注细分方向:综合对比产业链发展周期及未来市场空间容量,未来重点关注人形机器人及其相关产业链、AI应用、算力、储能、上游原材料等 [2][5] 市场资金面分析 - 国内居民资产配置:在经济增速中枢和固定资产回报率缓步下行背景下,无风险收益率进一步降低,伴随大量高收益资产到期,居民资产有望持续向权益市场增配 [3][5] - 国内机构资金配置:在政策持续引导及金融资管新规逐步施行下,机构类资金的权益配置偏好有望继续攀升 [3][5] - 资金共振:居民资产迁移与机构资金配置偏好攀升有望形成共振,为市场带来持续的增量资金 [3][5] - 海外流动性:美联储已进入降息宽松周期,在2026年有望实现多次降息,将进一步改善全球流动性,提振市场情绪 [3][6]
清华唐杰:领域大模型,伪命题
量子位· 2025-12-26 16:52
文章核心观点 - 文章系统阐述了人工智能大模型发展的八个关键方向与趋势 核心观点认为 通过持续扩大数据、参数和计算来扩展基座模型仍是最高效的路径 而模型能力的真正提升和价值的实现 依赖于对齐、推理增强、Agent化、记忆、在线学习等关键技术的发展 最终目标是让AI替代人类工作、创造增量价值 而非仅仅创造新的应用 [4][5][6][10][17][32] 关于基座模型扩展 - 预训练使大模型掌握了世界常识并具备简单推理能力 [4] - 获取更多数据、使用更大参数和更饱和的计算 仍然是扩展基座模型最高效的办法 [5] - 基座模型继续扩展规模仍然高效 [6] 关于激活对齐与增强推理能力 - 真实使用体验的进一步提升 绕不过对长尾能力的对齐和推理能力的增强 [6] - 激活对齐和增强推理能力 尤其是激活更全面的长尾能力 是保证模型效果的另一关键 [7] - 通用基准测试的出现评测了模型通用效果 但也可能导致模型过拟合 [7] - 真实场景下的关键是如何让模型更快、更好地对齐长尾场景 增强实际体验 [8] - 训练中期和后期的技术使得更多场景的快速对齐和强推理能力成为可能 [9] 关于智能体 - 智能体是模型能力扩展的里程碑 体现了AI模型进入人类真实世界的关键 [10] - 没有智能体能力 大模型将停留在理论学习阶段 无法转化为生产力 [11] - 原先智能体通过模型应用实现 现在模型已可直接将智能体数据集成到训练过程 增强了通用性 [11] - 不同智能体环境的泛化和迁移是难题 最简单的办法是增加不同环境的数据并进行针对性的强化学习 [11] - 智能体代表模型开始进入环境、开始形成生产力 [6] 关于模型记忆 - 实现模型记忆是模型应用到真实环境必须具备的能力 [12] - 大模型实现类似人类短期、中期、长期和历史记忆的不同阶段是关键 [13] - 上下文、检索增强生成和模型参数可能分别对应人类的不同记忆阶段 [13] - 一种方法是压缩记忆并存储在上下文中 如果大模型支持足够长的上下文 则有可能实现短中长期记忆 [13] - 如何迭代模型知识、更改模型参数仍是个难题 [14] 关于在线学习与自我评估 - 有了记忆机制 在线学习成为重点 目前大模型定时重新训练的方式存在浪费和丢失交互数据的问题 [14][20] - 实现在线学习是关键 自我评估是在线学习的关键点 模型需要知道对错才能自我改进 [14] - 构建模型的自我评价机制是个难题 [15] - 这可能成为下一个扩展范式 [15] - 模型的自学习自迭代将是下一阶段的必然能力 [20] 关于模型研发与应用结合 - 大模型发展越来越端到端 需将模型研发与模型应用结合 [16] - AI模型应用的第一性原理不应该是创造新的应用 其本质是通用人工智能替代人类工作 [17] - 研发替代不同工种的AI是应用的关键 [17] - 聊天部分替代了搜索 并融合了情感交互 [18] - 明年将是AI替代不同工种的爆发年 [19] - 大模型应用需要帮助人、创造新的价值 [34] - 如果AI软件没人用、不能产生价值 则没有生命力 [35] 关于多模态与具身智能 - 多模态是未来且有前景 但当下多模态不大能帮助提升通用人工智能的智能上界 [21][22] - 最有效的方式可能是文本、多模态、多模态生成分开发展 适度探索三者结合需要勇气和雄厚资本 [23] - 具身智能的痛点在于太难通用 少样本激活通用具身能力基本不可能 [23] - 解决方案是采集或合成数据 但这都不容易且昂贵 [23] - 一旦数据规模上去 通用能力出来自然会形成门槛 [24] - 机器人本身的不稳定和故障频繁也限制了具身智能的发展 [25] - 预计2026年这些领域将取得长足进步 [26] 关于领域大模型与大模型应用 - 领域大模型是个伪命题 通用人工智能实现后不应有领域特定的通用人工智能 [27][28] - 但在通用人工智能实现前 领域模型会长时间存在 [28] - 领域模型的存在本质上是应用企业希望构建领域知识的护城河 不希望AI入侵 希望把AI驯化为工具 [29] - AI的本质是海啸 将卷走一切 一定有一些领域公司会走出护城河 卷进通用人工智能的世界 [30] - 领域的数据、流程、智能体数据会慢慢进入主模型 [31] - AI的应用有两种路径:一种是将原有需要人参与的软件AI化 另一种是创造能替代人类某个工种的全新AI软件 [33]
揭秘Agent落地困局!93%企业项目卡在POC到生产最后一公里|亚马逊云科技陈晓建@MEET2026
量子位· 2025-12-25 14:08
文章核心观点 - Agent的真正价值在于能否在生产环境中稳定运行,而非仅展示惊艳的演示效果,数据显示超过93%的企业Agent项目在从概念验证到生产的最后阶段受阻[1][5][7] - 亚马逊云科技认为,一个成功的Agent需要模型、代码与工具三大模块的有效连接,这是当前最大的工程挑战[7][8][9] - 行业正意识到Agent是释放AI生产力的关键枢纽,亚马逊云科技通过一系列产品与更新,旨在降低开发门槛、解决工程化难题,并帮助企业跨越从概念验证到生产的鸿沟[5][6][19] Agent成功三要素与工程挑战 - **模型是大脑**:负责推理、规划与执行的核心决策职能[10] - **代码是逻辑**:服务于特定场景的功能实现,与传统软件开发类似[11] - **工具是手脚**:连接模型与物理世界,包括知识库、数据库、浏览器等外部能力[12] - **核心挑战**:如何高效连接模型、代码与工具三大模块,并解决工具间的编排复杂性[12] 开发效率提升:模型驱动开发 - **Strands Agents工具**:采用模型驱动方法论,大幅简化开发代码量,使过去需数千行代码的场景现仅需十几行代码即可实现[13] - **开源与开放**:Strands Agents定位为开源项目,提供完整源码,并采用开放架构兼容业界各种流行框架[13] - **重要更新**:在re:Invent 2025大会上,宣布Strands Agents支持TypeScript语言及边缘设备部署,以拓展开发者群体和应用场景[14][15] 从概念验证到生产的跨越难题 - **严峻数据**:93%的客户在从概念验证迈向生产环境时遇到重大障碍,仅不到10%的项目能成功推进到生产[16][17] - **核心原因一:数据质量落差**:概念验证阶段可使用精心筛选的高质量数据,而生产环境的数据无法人为优化,导致效果差异[18] - **核心原因二:工程化能力缺失**:生产环境需直面安全、扩容、成本、高可用等概念验证阶段无需考虑的问题[18] - **解决方案**:推出Amazon Bedrock AgentCore,提供底层基础架构编排工具箱,动态管理计算、网络、安全等资源,以解决工程化难题[19][20] 模型定制与效率优化 - **定制挑战**:通用大模型在垂直场景可能不足,定制需专业技能与高质量数据[22] - **最佳时机**:模型定制在基础模型训练阶段(类比人类幼年学习语言)进行,效果远优于模型完成后再调整[23][24] - **定制工具**:Amazon SageMaker AI提供强化微调、模型定制化训练等多种能力,其中Amazon Nova Forge允许在基础模型训练阶段注入用户数据[22][23] Agent的安全管控与自动化 - **行为边界**:需避免对Agent严防死守或过度放任两种极端,正确做法是通过策略框架划定行为边界[7][26] - **Policy策略**:为Amazon Bedrock AgentCore发布的新特性,可定义行为框架并配置合规性、安全红线等不可逾越的边界[27] - **工作流自动化**:推出Amazon Nova Act,深度集成大模型与AgentCore工程化能力,打造新型工作流自动化方案,整体成功率超80%,超越传统机器人流程自动化技术[29] 企业应用案例 - **Blue Origin(蓝色起源)**:通过亚马逊云科技服务构建超过2700个内部Agent,实现交付效率提升75%,设计质量提高40%[30] - **Sony(索尼)**:基于Bedrock构建企业级大模型,每天服务超过57000名内部用户,处理15万次推理请求,并通过微调将合规审核效率提升100倍[30]
Agent元年复盘:架构之争已经结束!?
自动驾驶之心· 2025-12-24 08:58
文章核心观点 - 2025年是Agent技术稳步落地的“Agent元年”,技术已就绪,爆发在局部,行业处于从技术架构探索向业务重塑过渡的中间态 [5][6][10] - Agent技术架构之争已定,收敛至以Claude Agent SDK和LangGraph的Deep Agent为代表的“通用型Agent”形态,其核心特点是主从架构(Main-Sub Agent)、自主规划、独立文件系统和上下文自动压缩 [3][57][58][59] - 构建有价值的“Deep Agent”需要满足两大特征:一是“够垂”,即具备源于行业深度实践的专业知识;二是“Long-running”,即能稳定、长时间运行并执行多步骤复杂任务 [11][12] - 将通用型Agent转化为垂类Agent的关键在于通过“Agent Skills”等优雅方式将业务知识丝滑融入,并通过分层工具调用、精细化的系统提示词工程来管理复杂度和确保稳定性 [22][41][52][62] 技术架构收敛与通用型Agent形态 - 技术架构在2025年10月后已收敛,标志是以Claude Agent SDK和LangGraph的Deep Agent为代表的架构 [57] - 收敛后的通用型Agent架构具备四大支柱:主从架构(Main-Sub Agent)、自主规划能力、独立的文件系统概念以及上下文自动压缩机制 [58][59] - 上下文自动压缩指当Token使用量达到上限(如200k)的80%时,系统会自动调用总结模型进行摘要压缩以释放空间 [59] - 分层工具调用是解决上下文拥挤的关键,例如Manus架构通过原子层、沙箱工具层和代码/包层三层设计,避免一次性灌输超100个工具导致的上下文混淆 [62][66][67] Deep Agent的核心特征与定义 - **特征一:行业性(够“垂”)**:Agent的知识和能力必须源于行业的深度实践和共识,包括业务定义的理想态、过往案例积累以及行业潜规则,其输出应达到或接近高级专家的水准 [11][12] - **特征二:Long-running(稳定性)**:包含两个关键维度,一是能长时间持续运行而不崩溃(如连续运行24小时),二是能连续、保质保量地执行涉及大量工具和API调用的多步骤复杂任务 [12] - **定义**:一个Deep Agent首先是一个Agent,其公认定义是“一个能循环运行工具以实现目标的LLM代理” [13][14] 构建Deep Agent的关键维度与方法 - **维度一:业务知识融合**:传统方法如融入Prompt或使用企业知识库(RAG)不够丝滑,Anthropic提出的“Agent Skills”提供了一种优雅解法,它通过多层级的文件系统封装指令和资源,让Agent能动态发现和加载,实现渐进式披露 [22][26][29][32] - **维度二:实现Long-running**:LangGraph的Deep Agent包提出了四大方法,包括规划、子代理、系统提示和文件系统,它们相辅相成,共同构成核心运作机制 [44][47][48][52][55] - **具体方法**: - **规划**:允许代理将复杂任务分解为步骤,跟踪进度并调整计划,以执行更长时间跨度的任务 [47] - **子代理**:用于实现上下文隔离、并行执行、专业化分工和提升Token效率,架构已收敛为由一个超强主代理按需调用子代理的模式 [48][49][50] - **系统提示**:最优秀的Agent拥有非常复杂详细的系统提示,用于定义规划标准、调用子代理的协议、工具使用规范及文件管理标准,通过提示工程承载应用复杂性 [52][53][54] - **文件系统**:用于上下文卸载、作为共享工作区、存储长期记忆以及封装可执行的技能或脚本 [53] Agent与Workflow的对比及开发范式转变 - **本质区别**:是复杂度的转移,Workflow将业务逻辑显式构建为“有向图”,而Agent将其抽象为自然语言,复杂度从“流程编排”转移到了“Prompt设计” [19] - **核心一致**:无论选择Workflow还是Agent,都在实践“Test-Time Scaling Law”,即通过良好的上下文工程,让模型消耗更多Token以换取更强的能力或更高的准确率 [20] - **开发范式**:相较于传统微调(SFT)动辄两周的周期,Agent模式跳过了耗时的数据准备,将迭代周期从“周级”压缩至“天级”,本质是通过消耗Token来换取效果的快速迭代 [74] 行业落地现状与挑战 - **验证过的成功**:如Deep Research和Claude Code已完全融入日常工作流,成为稳定可靠的生产力工具 [10] - **看不见的繁荣**:在招聘、市场营销、医疗等垂直领域,许多Agent产品早已实现百万美元营收,但由于大量业务集中在出海方向,导致国内体感不强 [10] - **核心瓶颈变化**:当前真正挑战在于“业务重塑”,即需要懂技术的一线从业者将传统SOP和行业知识解构,以Agent友好的方式沉淀为新工作流 [10] 从通用型Agent到垂类Agent的业务实践 - **升级路径**:将现有Workflow升级为Agent主要包括三步:1) 将业务文档、SOP抽象为Skills并存储在文件系统中;2) 将业务API封装为MCP服务;3) 为Main Agent和Sub Agent编写极度详细的系统提示词 [71] - **架构参考**:可模仿Claude Deep Research的主从Agent(Main-Sub Agent)Prompt架构,将复杂业务流程通过详尽的系统提示沉淀到主代理的认知体系中 [72] - **模型依赖**:这种方式的有效性高度依赖最先进的模型(如Claude 4.5、Gemini 3、GPT-5.2),若无法获得,则需降低任务复杂度进行尝试 [73]
进击的无招,进化的钉钉
钛媒体APP· 2025-12-23 17:40
公司战略与愿景 - 钉钉的产品定位发生根本性调整,从“为人服务”转变为“为AI(Agent)而生”,致力于打造一个帮助AI连接物理世界的Agent OS [4][7] - 公司创始人认为,在AI时代,中国有机会定义未来的工作方式,而钉钉正致力于抓住这个机会,打造一套全新的、全球性的AI工作方式 [4][34] - 公司将此次Agent OS的发布视为一次范式变革,类似于当年Excel的出现,标志着从单点AI功能到全面AI化工作体系的转变 [29][36] 产品演进与架构 - 新发布的AI钉钉1.1版本被比喻为“蝌蚪变青蛙”的中间态,是产品在AI时代进行根本性重构和重塑身体的过程 [5][8] - Agent OS的架构包含多个层次:底层是为Agent运行的沙箱环境(Real运行时),之上是模型层(含公开和企业内部模型),再往上是支持Agent调度的内核(Kernel),以及核心的AI原子能力(如语音、视觉、文本智能)[14][17] - 为支持开发生态,公司将提供两套平台:DingTalk Enterprise Agent Platform(支持Agent开发)和DingTalk Model Training Platform(支持模型训练)[19] - 产品界面将演化为AUI(AI用户界面),是GUI(图形用户界面)与LUI(语言用户界面)的自适应融合,根据上下文提供最合适的交互方式 [25] 组织与研发变革 - 公司内部研发团队被重组为5-7人一个的小组,所有人在具体场景中以Agent的方式进行创新 [4][9] - 公司强制要求每个研发人员的代码至少30%以上由AI生成,并且禁止手动编写文档,全部由AI完成 [4][9] - 产品需求的定义方式发生改变,所有讨论必须基于AI分析过的内容,摒弃以往靠想象做需求的方式 [9] - 公司认为比产品更重要的是团队发生了“彻底改变”,团队回归到创业心态,产品创新回归到以AI为中心 [7][9] 核心技术:Real与Agent OS - 公司发布了名为“Real”的硬件,其核心是为Agent提供一个有边界、可审计、在企业内部运行的沙箱环境(Runtime)[14][37] - Real运行时环境具备三个关键实体:Real Entity(真实实体,代表身份与权限)、Real Data(真实数据,含企业授权数据)、Real Time(真实时间,让AI具备时间概念)[14][15] - Agent OS的关键能力包括:Deep Research引擎(理解非结构化语言意图)、任务规划(Planning)、原子能力调度以及全程可审计(Audit)的机制 [17][18] - Real部署在企业内部,而非云端,这从根本上打破了国内互联网生态的封闭性,使得AI能真正连接和操作信息,推动了工作范式的改变 [36][37] 市场表现与用户反馈 - AI表格用户量暴涨,曾因瞬间流量突破系统极限而导致文档服务宕机,显示其增长前所未有 [30] - AI听记呈现爆炸式增长,已渗透到学生市场(小学至大学)以及律师、医生等专业领域,有些律所甚至上千台地集体导入 [30] - AI客服等产品已被市场接受,很多人购买,AI听记曾出现卖断货的情况 [27] - 一些曾经离开钉钉的企业,已经开始主动回归,首次AI发布会展现的未来判断正在帮助挽回大量客户 [36] 场景与应用创新 - 产品创新逻辑转向基于具体场景,例如“AI听记里记者采访”场景,由专门团队做透,并构建记者专用的分析模型和Agent [11][12] - 引入AI后,许多传统流程正在消失,例如使用AI听记自动记录和分析客户拜访后,企业不再需要传统的CRM系统和手动填写流程 [31][32] - AI表格让数据存储的目的从给人看转变为让AI理解,这催生了新的应用开发方式,取代了许多传统的OA流程和应用软件 [29][30] - 公司以“北极星指标”定义核心场景优先级,例如要求团队在三个月内为某个场景做到100万用户量 [12] 生态与合作策略 - 公司当前更关注为生态合作伙伴提供赋能,重点是提供工具(如算力、算法、模型、数据支持)降低他们开发AI应用的门槛 [26] - 在钉钉平台上开发,合作伙伴可以享受平台巨大的流量优势 [26] - 公司认为当前从传统软件转向AI开发的“技术跨度”比2014年钉钉1.0发布时还要大,许多传统服务商尚未掌握大模型能力 [26][27]
双第一!百度智能云领跑2025云厂商大模型中标市场
搜狐财经· 2025-12-23 16:19
大模型招投标市场整体规模与厂商格局 - 2025年1-11月,中国主流云厂商大模型相关中标项目累计达291个,中标金额突破21亿元[1] - 百度智能云以95个中标项目和7.1亿元中标金额,成为中标项目数和中标金额最多的云厂商[1] - 火山引擎、阿里云分别位列第二和第三位,中标金额分别为4.75亿元和3.62亿元[1][2] - 腾讯云和华为云分别中标41个项目(金额1.10亿元)和31个项目(金额4.46亿元)[2] 行业应用分布与需求特征 - 大模型招投标TOP5行业依次为金融、通信、能源、政务和教育科技,中标项目数分别为91个、45个、28个、27个和24个[3] - 行业需求展现出智能化转型的强劲动力,企业选用大模型时更注重供应商的落地能力[3] - 企业需求从仅看重模型效果,转向需要一整套从模型部署到Agent开发应用的系统化工程能力[3] AI规模化落地阶段的新趋势 - 2025年大模型市场进入AI规模化落地与复购期,企业更关注系统稳定性、工程交付能力和长期运维成本[4] - 大模型需要与企业原有系统深度耦合,对数据安全、响应时延、系统稳定性提出更高要求[4] - 金融行业项目金额高,对交付周期和可控性要求高,持续中标反映了厂商底层能力的成熟度[4] - 中标厂商需具备稳定算力供给、模型、工具链、Agent开发和运行环境一体化能力及已验证的工程经验[4] - 百度智能云在金融、政务等领域领先,已成为65%央企、100%系统重要性银行及800+金融机构落地大模型的首选[4] 云服务市场竞争格局演变 - 云厂商竞争走向分化,“租算力”传统模式已不适应AI大模型时代,市场出现全栈云、垂直云、专注模型服务及高性能AI专用基础设施的新型厂商[5] - 真正的AI云需要提供从底层算力、AI开发平台与框架到上层应用与行业解决方案的闭环全栈服务能力[5] - 企业落地AI越来越倾向Agent形式,推动竞争焦点从算力规模与价格转向提供Agent开发与运营的全栈能力[5] - 国内外云厂商(如谷歌、亚马逊、微软、阿里、华为)为提供更好Agent服务,均在力推自研芯片和模型[5] - 百度智能云升级发布AI Infra+Agent Infra新一代全栈AI基础设施,提供从算力、模型到Agent开发落地的一体化解决方案[5] 未来云市场竞争方向 - AI时代云市场从单一基础设施建设比拼,走向更广阔的全栈和平台能力竞争[6] - 随着更多行业进入AI应用深水区,大模型招投标市场的分化仍将继续[6] - 未来云厂商比拼的不再是谁能提供更便宜的API,而是谁能在真实业务中帮助企业创造价值[6]
别再卷RAG了,Agent才是「超级生产力」| 极客时间
AI前线· 2025-12-23 15:29
文章核心观点 - 2025年是Agent技术从概念走向商业主流的转折点,拥抱Agent已成为企业和个人在智能化浪潮中的生存题[2] - Agent是一种“自主智能体”,具备感知环境、分析目标、自主决策并持续进化的能力,不同于作为“工具”的传统AI,它更像“数字助理”或“超级外挂”[2] - 开发者需要实现认知升级和技能重构,从思考“AI替代岗位”转向“如何用Agent放大自身价值”,并掌握提示词工程、目标拆解、人机协作等新语言[6] Agent技术定义与核心能力 - Agent的核心能力包括:感知-决策-执行闭环,通过LLM+强化学习框架自主拆解任务[2];工具调用能力,可直接操作GitHub API、K8s集群、云服务控制台[2];记忆进化机制,通过向量数据库+RAG实现长期经验沉淀[2] - Agent的崛起主要得益于其自主执行能力与广泛的实用性,商业化临界点已至[13] Agent技术生态与资源 - 存在丰富的开源Agent框架与工具,例如AutoGPT、MetaGPT、LangChain、Llamaindex、AutoGen、Dify等[2][17][21] - 技术社区提供了大量学习资源,包括视频教程、行业研究报告、技术解读文章及配套课件,例如“大模型时代的Agent开发方法论”2小时精品视频课[4][8] - 行业已整理出详细的知识库,涵盖多Agent协同调度、企业数据分析应用、具体产品列表以及11个顶级开源Agent框架介绍等[11][13] Agent核心技术栈 - 核心技术栈涵盖多个层面:大语言模型作为基础,例如GPT-4/4o、Claude 3、Qwen2、DeepSeek V3等[17];记忆与知识管理,涉及向量数据库、知识图谱及长短期记忆机制[16];多智能体协作技术,包括协作协议与通信协议[15][17];开发框架与工具链[17];评估与调试方案[17] - 检索增强生成是关键技术之一[16] - 模型上下文协议被视为Agent领域的“万能插头”[16][17] Agent开发实践与应用 - 存在具体的开发实践教程,例如在10分钟内于Windows环境使用Dify和DeepSeek搭建Agent[19] - Agent已在医疗、教育、金融等超过10个领域拥有实战案例[20] - 技术社区有大量相关视频推荐,内容涵盖智能体搭建、测试用例生成、技术解析及公开课等[19][20][21] 相关学习与求职资料 - 为助力技术学习和求职进阶,整理了包括“中国AI Agent产品罗盘”、“AI Agent行业研究报告”在内的系统学习资料[8] - 提供了AI大模型面试题集,涵盖Agent架构设计、前沿技术、基础理论以及Transformer、RAG等相关高频考点,文件大小从139.42KB到3.48MB不等[22][23]
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify
量子位· 2025-12-23 12:16
文章核心观点 - 2025年被定义为“Agent元年”,行业焦点从年初的宏大叙事转向年末的工程化落地,Agent正从技术萌芽走向务实应用 [1][2][3] - Agent的快速共识源于其能真正解决问题,并伴随一系列工程方法(如Agent Infra、Runtime、架构范式)的快速成型,实现了落地 [12] - Agent落地面临的核心挑战是其作为一个“不确定性的复杂系统”,需要确定性的工程方法(如科学实验思维、Day Two思维)来驾驭 [6][19][20] - Agent Infra是智能体落地的关键一环,它通过解决安全、执行环境、工具、记忆和观测等“偶然复杂度”问题,为Agent的可靠运行和智能进化提供支撑 [5][23][38] Agent发展阶段的总结 - Agent发展已从年初硅谷的“宏大叙事”和“立法阶段”(靠Demo吸引资本),进入年末充满“烟火气”的“司法阶段”,处理具体、琐碎的执行问题,走向务实 [6][9][10][11] - 行业发展并非线性进步,而是“根茎状的蔓延”,秩序的建立更多依赖于产品工程、提示词工程、RAG、Pipeline等“胶水”技术 [12] - 共识的形成部分源于资本在互联网红利见顶后,寻求新的组织方式,Agent承诺了“交互成本的坍塌” [12][13] Agent落地与AI落地的区别 - 范式发生明显转移:从传统的if/else逻辑判断和确定性功能交付,转向Agent的“概率性目标规划”和“概率性能力”交付 [14][18] - 关键区别在于“新增了很多不确定性”:Agent的失败是对意图的误解或概率漂移,修复方式从“修Bug”变为像“教育孩子”一样进行约束 [18] - Agent是一个由模型、架构、Prompt、工具等七八个因素相互影响构成的“不确定性的复杂系统”,其输出具有不确定性,与传统微服务系统相反 [19] Agent Infra的角色与关键要素 - Agent Infra的核心作用是解决企业在Agent落地中遇到的“偶然复杂度”问题,而非业务本身的本质复杂度 [6][23] - 当前Infra层致力于构建解决偶然复杂度问题的“最大公共子集”,包括:安全、执行环境、工具、记忆和观测 [23] - 在Agent Infra中,“安全”尤其是“Agent的自主运行”带来的破坏性风险是最突出的问题,需要多层次、全链路的安全体系(如安全沙箱)来解决 [21][25][26] - 对于Infra的开闭源选择呈现分层互补:初创公司和创新者倾向于开源以获得低成本、灵活性和透明度(白箱);大企业则倾向于商业版或闭源以获得责任转移与兜底服务 [27][28][29] 技术进展与未来趋势 - **AI代码工具**成为标志性实践和重要趋势:它不仅是解决代码问题的工具,更成为Agent连接现实世界的通用接口,并颠覆了原有的软件工程范式,推动从AI Coding到AISE(AI软件工程师)的转变 [7][33][34] - 技术正在从开发者向非开发者移动,简化程度逼近“AI开发的Excel时刻”,将基础设施认知负荷降至最低,使开发者能聚焦于Prompt和数据治理 [31][35] - Agent Infra的下一步重点是从“服务好Agent的运行构建”转向“服务好Agent的智能进化”,关注其安全可靠运行,并利用运行数据持续优化Agent本身和模型 [38] - 未来重点方向可概括为:**秩序**(让混乱模型可控)、**连接**(打通Agent孤岛融入业务)、**自动**(任务自动化)、**安全高效**、**智能进化**、**人机协同** [39] - 记忆管理需要超越简单的向量搜索,关注语义化的情景记忆和可计算的时间观,将记忆和目标视为可重写、降级的变量并进行置信度处理 [40] 对开发者和企业的影响与门槛 - 对于中小公司和个人开发者,最大的门槛并非技术或成本,而是**缺乏开始的勇气**以及企业**数据的壁垒**;同时,**商业模式**的探索和转变是关键,因Agent尚未到全面改变社会商业模式的阶段 [6][40] - 对于专业开发者和AI原生企业,Infra产品主要帮助治理其面临的复杂问题,加速Agent落地 [31] - 若Agent成为主流,将对移动开发生态产生影响:公司会要求在APP中集成Agent能力,促使开发者思维从工程转向科学实验;利用AI Coding工具开发APP则要求改变协同模式和工具体系 [41][44] - 未来的应用交互形态(如iOS/Android)尚无定论,但只有那些与AI工具为伍、改造研发流程并用科学实验思维驾驭不确定性的人,才能抓住形态转移的机遇 [42][43]