Workflow
Agent
icon
搜索文档
MaaS做到第一后,火山下一步怎么走?
雷峰网· 2025-12-19 12:55
文章核心观点 - 云行业正面临传统商业模式困境,而大模型与AI Agent被视为关键的突破口[2] - 火山引擎通过率先确立并实践MaaS(模型即服务)战略,在中国公有云大模型市场取得了领先地位,并正将竞争优势延伸至Agent基础设施(Agent Infra)领域[3][6][9] - 公司推出的企业级Agent开发平台“AgentKit”,旨在解决Agent规模化落地中的安全、系统改造和评估观测三大核心挑战,从而巩固其AI云生态并驱动长期增长[19][21][34] 火山引擎的MaaS战略与市场地位 - 2025年上半年,中国公有云大模型调用量达536.7万亿Tokens,火山引擎市场份额为49.2%,排名第一[5] - 公司是中国首家制定MaaS战略的云厂商,其商业模式从“卖算力”转变为“卖Tokens”,通过豆包大模型等产品实现商业营收并驱动模型迭代的数据飞轮[6] - 为促进调用和生态发展,火山引擎将豆包大模型计价单位从“分”降至“厘”,价格降幅达99.3%[7] - 2025年冬季,火山引擎日均大模型调用量达50万亿Tokens,国际排名第三,仅次于OpenAI和Google,国内排名第一[35] Agent的发展趋势与行业机遇 - Agent被视为AI时代的核心应用形态,如同PC时代的门户网站和移动互联网时代的App,是距离用户更近、更易商业化的路径[12] - 2025年AI Agent创业热潮涌现,吸引大量人才和资金进入,这些创业者成为云厂商争相服务的核心客户群[12] - 云厂商的传统“卖水卖铲子”(提供基础算力)模式已不足够,需要提供更贴近Agent开发需求的工具和服务[13] AgentKit平台的设计逻辑与竞争优势 - AgentKit是火山引擎推出的企业级Agent开发平台,覆盖Agent应用落地的全生命周期[19] - 与AWS、微软等提供的SDK式工具不同,AgentKit定位为完整的、开箱即用的云原生Agent基础设施[20] - 平台背靠火山引擎的AI云原生架构,旨在让企业能简单、安全、高效地开发并运营可投入生产的Agent,而非仅制作Demo[19][20] AgentKit解决的核心企业挑战 - **安全挑战**:通过Identity(身份)、Gateway(网关)、Guardrails(围栏)三大模块,为Agent提供清晰的身份权限管理、统一访问入口和内置安全规则,解决权限管理与越界风险[22][23][24] - **系统改造挑战**:通过Memory(记忆库)模块,帮助企业构建可管理、可治理的上下文记忆和知识体系,降低对接原有复杂数据系统的难度[27] - **评估与观测挑战**:通过Observation(观测)模块实现决策链路追溯,通过Evaluation(评测)体系进行量化评估,该体系已累计对1万多个Agent进行20万次评估,并提炼出超过50个标准化评测器[28][30] - **开发环境挑战**:提供Runtime(运行时)和Sandbox Tool(沙箱工具),支持Agent在生产级环境中运行,并将高风险调用隔离在沙箱内[30] AgentKit的实际应用效果 - 在某汽车厂商案例中,AgentKit为其车载终端Agent提供了全方位安全体系,有效应对海量的提示词注入与数据投毒攻击[25][26] - 在金融场景中,为某券商提供了SWE Bench自动评测集,降低了存储与维护成本;其沙箱工具支持高效任务调度,将训练响应提升至毫秒级,缩短了实验周期[31] - 基于AgentKit开发的“智能会议助手”,相比传统开发模式,代码量减少了96%[31] 火山引擎的AI云发展路径 - 公司的发展路径被概括为:传统云突围靠AI,AI云突破需从卖算力进化到建设以MaaS为中心的模型和商业飞轮,而做好MaaS的核心在于建设AI Infra以帮助用户做出能赚钱的专业Agent[34] - 火山引擎以AgentKit为矛头,深入服务专业级开发者,旨在通过击穿核心用户圈层,逐步辐射更广泛用户,实现AI云业务的长期发展[36]
提升Agent的可信度后,企业会多一批好用的“数字员工”吗?
36氪· 2025-12-19 08:11
Agent技术架构的演进与核心差异 - Agent与Chatbot存在本质区别,Chatbot仅是交互界面,而Agent具备任务规划、执行、感知反馈和动态调整的完整能力,其技术复杂度和对生态的要求远高于传统对话系统[2] - 以行动为目的的AI核心在于关注结果,Agent模式实现了流程自动化,将原本由人维护的任务规划、工具调用和上下文管理能力内化,使Agent能在循环中持续工作数十分钟甚至数天[3] - Agent的兴起扩展了AI的可操作范围,未来传统软件界面可能消失,由Agent与系统直接交互[4] 当前Agent发展的关键瓶颈与优化方向 - 高性价比算力短缺是当前主要瓶颈,许多应用为控制成本而使用30B或7B等较小模型,并将上下文窗口限制在32K或更小,同时限制深度思考轮次[5] - 上下文数据质量至关重要,低信息密度和高噪声数据会严重影响输出结果,需要通过数据预处理和更频繁的上下文压缩技术来提升信息密度和可靠性[6] - 企业私有数据质量是决定Agent效果的关键因素,其预处理和构建的难度远大于模型选择或微调[6] - 随着处理链路变长,即使每个环节可用性达90%,经过十个环节后整体可用性也会下降到不可接受的水平[7] 多Agent协作与协议标准化趋势 - 未来必然是多Agent协作的世界,且交互关系将呈多对多、开放式,统一的Agent交互协议至关重要[8] - 行业普遍认为协议将走向开源统一,速度可能非常快,类似Kubernetes、gRPC等近代协议约两三年就进入中立治理阶段,MCP协议在发布约一年后已被捐赠给AIF[8] - MCP协议已获得各大厂商大力支持,并基本成为多Agent沟通的事实标准,其上层生态仍在不断创新,例如Anthropic的PDC协议可将多次MCP调用合并,使上下文长度缩短80%甚至更多[9] - 协议的价值在于让生态中各角色使用同一种语言沟通,使各方能专注于自身专业领域,无需耗费大量时间做适配工作[4][7] 企业落地Agent的成本与精度权衡 - Agent长程推理任务会导致上下文膨胀,显著增加显存、带宽消耗和成本,需通过上下文压缩、长期记忆持久化等“上下文工程”手段提升信息密度[10] - 可通过优化KV Cache,如利用CPU内存或SSD进行分层存储及不同层级量化来提升系统吞吐,但这会带来1%到10%的精度损失[11] - 成本与精度的权衡必须与业务深度结合,高容忍度业务可使用低成本、精度略低的模型,而容错度低的场景则必须使用高精度方案[11][12] - 在C端对话场景,若1秒内不能输出首token,用户体验基本失败,总体上需在1–2秒内给出首token并保持持续输出[31] 知识图谱与长期记忆的技术优势 - 知识图谱具备知识压缩、事实边界与操作约束等特性,是企业知识的高度浓缩,以结构化方式提供给大模型时,其约束和提示效果远强于冗长文本[12] - 相比RAG,知识图谱更能保证信息的完整与高度相关,查询实体时所有相关内容都能被提取,生成的上下文质量更高、长度更短、效率更高[13] - 知识图谱符合人类记忆模式,能支持Agent的长期记忆和自我进化,例如将成功运维经验写入图谱后,相同任务处理时间可从20分钟缩短到5分钟[14] - 从算力角度看,从知识图谱中精准取回高信息密度节点,比将整本书塞进context window要划算成百上千倍[15] 企业AI项目落地与价值评估维度 - AI价值主要体现在提效和赋能新事物两方面,当前AI在许多场景可达初级到中级人员能力水平[18] - 对于高频次、规则性强、容错率允许的工作,交给AI效率显著更高,AI在创意类任务中也表现突出[19] - 评估AI项目需关注:业务方能否明确AI的衡量标准、业务方是否掌握数据用于提示或微调、业务方是否有预算[20] - 能够实实在在为企业赋能的,是那些已被大规模使用的AI应用,如AI Coding,其效率提升和性价比是确定的[18] Agent业务对齐与调度策略 - Agent落地最难的不是协议对齐,而是业务对齐,相同的词在不同业务场景中有不同的语义,需与合作伙伴在业务理解上达成一致[20][21] - 大模型带来的挑战是技术人员需向前迈一步,不仅要掌握技术,还要理解业务需求和业务语言[23] - 在处理复杂流程时,调度逻辑可采用SOP写死、模型动态规划或两者混合的方式,取决于具体场景要求[25][27] - 在异构集群调度中,需根据不同类型节点的压测结果调整负载评估逻辑,并采用组合策略,根据workload的SLA要求进行分配,以兼顾性能与性价比[28][29] Agent可信性与安全熔断机制 - 目前提升Agent可信性主要依赖RAG和知识图谱,但幻觉问题无法100%解决,要求完全无幻觉的场景仍需依赖外围机制或校验流程[28] - 熔断机制包括:设置循环阈值、为API key设置rate limit和预算上限、通过沙盒机制实现执行环境隔离、监控Agent执行状态并在异常时外部kill[31][32] - 需对模型的任务规划和执行模型进行调整,确保符合可信标准,避免生成离谱操作,并在执行中加入安全检查[33] Agent未来形态与技术人员能力发展 - 长远看,传统软件形态可能消失,软件核心功能以API形式暴露给Agent,由Agent承担软件外壳作用[35] - 技术人员需理解Agent工作原理、调度和交互机制,但更核心的依然是对计算机整体运行机制和底层原理的理解[36][37] - 2026年,多Agent治理体系可能成为爆发的技术变量,生产级多Agent落地将大规模发生,但其运维、调试和监控的复杂性将呈指数增长[38] - 市场对Agent的认可度显著提高是关键,需要用户和企业找到适合自身业务的使用方式,发挥其长板、规避短板[40][41]
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-18 23:26
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,相比今年9月的30万亿有显著增长 [2] AI Agent的发展现状与挑战 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突” [2] - 火山引擎总裁认为行业发展阶段尚早,AI落地处于早期,所谓“冲突”本质取决于观察视角 [2] - AI的核心价值在于让用户更便利、更低成本地达成目标,而非载体形式 [2] - Agent不会淘汰现有载体(如Web、APP),而是会形成共存互补的格局,并因需求扩容和用户时长增加而发展 [2] - 行业对AI与Agent的探索仍处于摸索阶段,这种状态预计还会持续三年左右 [3] - Agent待突破的两大核心挑战包括基础能力支撑与真实线上落地要求,需满足健全性、稳定性、弹性伸缩、数据安全等高标准 [3] 多模态大模型的发展与竞争 - 多模态大模型(如Seedance 1.5 pro)的更新迭代,标志着AI应用正往更深场景发展,让大模型能“看、听、说、做” [4] - 多模态能力对于需要视觉输入的实际应用场景(如路况识别、产品质检、餐饮服务)至关重要 [4] - 模型调用工具后返回的结果常是图片、视频等视觉化内容,模型需要能看懂才能继续处理 [4] - 火山引擎总裁认为多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 关于竞争,厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 火山引擎持续强调AI时代云服务的价值 [4] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务相媲美 [4] - 火山引擎总裁认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:两年前行业GPU出货量已超过CPU,MaaS也将迈入从训练转向推理的过程 [4] - 以2025年初AI浪潮为例,DeepSeek带火一体机销售但最终很多人“砸”手里,核心原因是AI技术快速迭代(甚至三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署 [5] - 一体机固定算力很难支撑丰富的AI应用落地 [5] - 基于此判断,软件时代的私有化一体机模式在AI时代将被淘汰 [5]
对话火山引擎谭待:多数人低估了火山拿下 AI 云的决心
晚点LatePost· 2025-12-18 19:58
公司战略与目标调整 - 火山引擎主动上调了2021年设定的千亿元年营收目标,在原定2029-2031年实现周期不变的基础上,目标金额上调了数百亿元 [2] - 公司对2024年的营收目标为翻倍增长至200多亿元,并已超额完成该目标 [32] - 公司认为在AI云领域的竞争中,加速度(即增长率的提升速度)比当前的速度或差距更为重要 [5][32] 业务表现与关键数据 - 豆包大模型日均Token处理量在2024年12月超过50万亿,半年内增长超过200% [2] - 火山引擎平台上累计使用上万亿Token的外部客户超过100家,数量是全球云计算巨头AWS的两倍 [2] - 公司MaaS(模型即服务)收入和豆包大模型能力提升均超出预期 [2] - 在Gartner发布的AI应用开发平台魔力象限报告中,火山引擎位列国内第一 [29] 产品与技术进展 - 豆包基础大模型升级至1.8版本,强化了多轮指令遵循与OS Agent能力,可理解长达1.5小时的视频(5秒1帧) [3] - 能力更强的豆包大模型2.0版本正在训练中,即将上线 [3][6] - 视频生成模型Seedance升级至1.5 pro版本,重点提升音画同步、多人多语言对话能力及电影级画面质感,并能处理包括四川话、陕西话在内的多种方言 [3][7] - 公司对视频、图像生成模型有信心做到国际领先,而基础语言模型的短期目标是进入第一梯队 [7] 定价策略与商业模式创新 - 公司推出整体的“节省计划”定价模式,覆盖豆包系列大模型、DeepSeek等开源模型及向量数据库等周边产品,旨在让客户用得越多,节省越多 [4][8][9] - 该模式是MaaS(模型即服务)层面的行业首创,源于公司拥有大量客户使用基础 [11] - 公司此前已通过两次技术优化实现降价:2024年5月通过Prefill-Decode分离和KV Cache技术降低单Token成本;2025年6月通过优化Context区间定价 [9] 产品体系与降低创新门槛 - 公司搭建了从MaaS到Agent开发、运营的全栈产品体系 [4] - 推出“豆包助手API”,将豆包App中的复杂Agent能力(如对话、搜索、思考)封装成高层级API,供客户直接调用,大幅降低创新门槛 [12][14][17] - 推出全栈的AgentKit产品,覆盖Agent的权限管理、身份认证、Memory、安全、可观测性等,简化复杂Agent的开发 [15] - 提供推理代工服务,允许客户将自有或开源模型托管在方舟平台上,享受全托管服务 [15] 市场认知与竞争优势 - 公司认为其ToC和ToB业务的协同具有巨大优势,不仅是品牌,更在于过程中积累的实践经验(know-how) [5][21] - 公司内部有50多个业务线在不断尝试AI应用,包括豆包、即梦等大型Agent,这为其产品开发提供了深刻的洞察和验证 [21] - 作为后发者,公司认为包袱大小不是关键,关键在于如何设计策略并打好手中的牌 [28] 客户与行业应用 - 深度使用大模型的客户主要集中在ToC行业,互联网公司是大头,同时智能制造、消费电子及汽车行业用量也不少 [25] - 影视创作领域应用大模型的进程超出预期,短剧、漫剧及广告素材制作是主要场景 [23] - 公司与全球出货前10的手机厂中的9家有合作,并在汽车座舱领域进行深度合作,提供AI解决方案 [25] 组织与激励策略 - 公司给予销售团队的业绩考核指标中,销售MaaS产品排在第一位,销售同等价格的MaaS获得的回报高于传统云服务,该策略明年将继续延续 [26] - 公司强调组织上下坦诚清晰的沟通(Context, not Control)以及灵活调整的能力是其重要的组织能力 [27] - 公司在国内成立了行业线,旨在推动制造业、能源等传统行业的AI创新 [31] 市场竞争与行业展望 - 公司欢迎更多同行(如阿里云)将MaaS作为业务长期成功的首要指标,认为这有助于共同做大中国MaaS行业规模 [4][30] - 中国MaaS市场目前规模小于全球市场,部分原因在于国内SaaS生态较弱,但这可能也是弯道超车的机会 [29] - 公司认为MaaS业务本身市场潜力巨大,其增长也能附带撬动传统云业务的增长,但目前这一趋势尚不明显 [31]
腾讯大模型团队架构调整,前OpenAI研究员姚顺雨出任要职|36氪独家
36氪· 2025-12-17 23:18
腾讯AI战略与组织调整 - 近期完成组织调整,新成立AI Infra部、AI Data部、数据计算平台部,以整合内部力量,统一模型团队[4] - 任命Vinces Yao(姚顺雨)为首席AI科学家,并兼任AI Infra部、大语言模型部负责人,其曾为OpenAI研究员,是Operator与Deep Research核心贡献者[4] - 新成立的AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设[6] 人才争夺与团队建设 - 在AI人才招聘上表现激进,2025年校招对中意人才出价高50%是基准线,最高可达2倍薪资挖人[8] - 正以加倍薪资积极挖角字节跳动等公司的顶尖AI人才[8] - 新任负责人姚顺雨已帮助混元团队从字节、阿里及多家AI初创公司招募到数位核心员工[9] 自研模型进展与成果 - 整合原有团队并调整训练目标后,成果迅速显现,于12月5日发布全新大模型HY 2.0,在推理和效率上有显著进步[10] - 整个2025年,混元团队发布了超过30个新模型,其3D模型已位居全球领先梯队[10] - 公司内部已形成共识:必须拥有不能拖后腿的自研模型能力[4][17] 市场竞争与产品化驱动 - 2024年第三季度开始感受到紧迫感,外部重要因素是字节旗下豆包日活逼近1000万,被视为产品初步站稳脚跟的分界线[14] - 决定坚定在AI助手类应用方向加大投入,必须以产品化、商业化方式竞争,并于2025年初将“元宝”应用调整至云与智慧产业事业群[15] - 借助开源模型DeepSeek,“元宝”月活在2025年初1个月内突破4000万,一度在苹果免费下载榜跃居第一,但后续增长放缓,凸显自研模型的重要性[15][17] 行业趋势与未来赛点 - 行业验证铁律:模型能力决定产品上限,对话依然是AI应用的核心形态[19] - 智能体正成为下一个竞争赛点,字节推出豆包手机将赛场推向新阶段[20] - 公司总裁刘炽平明确表示微信最终会推出一个智能体,但同时指出AI市场仍处于非常早期的发展阶段[23]
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
量子位· 2025-12-17 18:00
腾讯AI组织架构与人才引进 - 腾讯内部官宣大模型研发组织架构调整,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化大模型研发体系与核心能力 [6] - 姚顺雨加盟腾讯,出任“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [4][7] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术 [8] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [8] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [8] 姚顺雨背景与成就 - 姚顺雨是前OpenAI研究员,拥有清华大学姚班背景和普林斯顿大学计算机博士学位,是NOI奥赛银牌得主和安徽省高考探花 [2][16] - 他是Tree of Thoughts(思维树)、ReAct等知名研究的作者,也是SWE-bench、SWE-agent等一系列研究的核心贡献者 [3][27] - 博士期间师从GPT-1第二作者Karthik Narasimhan,从事智能体方向研究,毕业后加入OpenAI [18] - 其研究工作贯穿Agent研究关键节点,包括提出CALM、WebShop等 [19] 姚顺雨的AI发展观点 - 姚顺雨在2024年8月发表博文《The Second Half》,提出AI正处在“中场休息”阶段 [21] - 他认为AI上半场以模型和方法为中心,核心是“把模型训出来”;下半场重心将转向任务定义、系统构建与评估体系 [22] - 关键问题从“能否训练模型解决XX”转向“什么问题值得被解决”以及“如何判断AI是否真的进步”,评估成为决定方向的前置条件 [23] - 真正重要的不是继续堆模型规模,而是让模型在真实任务和系统中经得起检验 [24] - 他认为Agent的本质不是“会用工具”,而是“能推理并泛化” [26] - 创业公司的最大机会不在模型,而在交互方式 [28] 腾讯AI产品与业务进展 - 过去一年,腾讯混元大模型发布了超过30个新模型 [9] - 2024年12月5日发布的混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [9] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [9] - 腾讯元宝AI应用用户规模稳居国内前三,成为最受新中产欢迎的AI原生应用,上线初期保持每天一个版本的迭代频率 [10] - 腾讯将元宝的AI能力融入微信、QQ、音乐、会议等国民级产品中 [10] - 腾讯混元大模型已在内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [10] - 公司内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [10] 腾讯AI战略与行业地位 - 腾讯被认为拥有完备的AI要素:丰富场景、海量数据、生态资源,以及谋定后动的战略风格 [14] - 公司通过组织变阵、人才引进、产品(如元宝)和开源(如混元3D)等多方面举措,明显开启了AI进程上的提速 [12][13] - 引进姚顺雨这样的顶尖人才,被视为腾讯开启AI攻坚的证明 [11]
腾讯大模型团队架构调整,前OpenAI研究员姚顺雨任要职 | 智能涌现独家
36氪· 2025-12-17 16:45
公司组织架构调整 - 腾讯近期完成组织调整,新成立AI Infra部、AI Data部、数据计算平台部 [1] - Vinces Yao(姚顺雨)出任首席AI科学家,向总裁刘炽平汇报,并兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [1] - 新成立的AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的智能融合平台建设 [2] - 此次调整旨在统一原分散于不同事业群的模型团队内部力量,使模型团队内部力量更加统一 [2] 人才战略与招聘 - 腾讯正在以高薪积极抢夺AI人才,特别是字节跳动的AI团队,过去数月里以加倍薪资挖角顶尖人才 [3] - 在校招中,腾讯对中意人才的出价基准线为高出50%,最高可达2倍薪资 [3] - 姚顺雨加入后,已帮助混元团队从字节、阿里及“AI六小虎”等公司招募到数位核心员工 [3] - 顶尖人才的变动反映了公司对AI业务的急迫程度,腾讯瞄准全球范围内的顶尖大模型人才 [3] 产品进展与市场表现 - 腾讯于12月5日发布全新大模型HY 2.0,显著改进了预训练数据和强化学习策略,在推理和效率上取得进步 [4] - 2025年全年,混元团队发布了超过30个新模型,其中3D模型已位居全球领先梯队 [4] - 2025年初,公司将元宝从TEG调整至CSIG,由腾讯会议负责人吴祖榕带队 [8] - 借助开源模型DeepSeek,元宝月活在1个月内突破4000万,一度在苹果免费下载榜上力压豆包跃居第一 [8] - 2025年中旬,元宝的高增速一度出现放缓,但在基模能力提升后,App表现有明显提升 [10] 竞争环境与战略转向 - 字节跳动旗下的豆包日活已逼近1000万,这被腾讯视为产品初步站稳脚跟的重要分界线 [8] - DeepSeek的发布使腾讯在2024年第三季度明显感受到紧迫感,元宝团队曾笼罩在焦虑中 [7] - 公司高层意识到必须拥有不能拖后腿的自研模型能力,因此坚定在AI助手类应用方向加大投入,必须以产品化、商业化方式竞争 [8][10] - 行业竞争正在升级,Agent(智能体)成为下一个赛点,字节推出的豆包手机将竞争推至新阶段 [11] - 腾讯总裁刘炽平在2025年三季报电话会上明确表示“微信最终会推出一个Agent”,但同时认为AI市场仍处于非常早期的发展阶段 [12] 面临的挑战 - 对于腾讯而言,如何将AI能力嵌入微信这类国民级应用,同时不损伤原有产品体验并符合隐私和合规要求,是比技术追赶更大的难题 [12] - 与没有社交入口包袱的字节相比,腾讯在推进AI Native产品形态时需要考虑更多因素和面临更大阻力 [12]
穿越周期的早期投资:从赛道思维到认知红利|甲子引力
搜狐财经· 2025-12-16 18:45
文章核心观点 - 在AI、具身智能等赛道高度拥挤、共识形成极快的市场环境下,早期投资的决胜点已从“赌赛道”转向对“人、周期及非共识”的深刻理解,即挖掘“认知红利” [1][2] - 投资机构正通过全链条布局、深度研究输出、个人IP打造等不同方式构建独特的“认知模型”和项目雷达,以在红海中识别机会 [1] - 保持投资“手感”、建立正向反馈循环以及在行业低谷期坚持布局,是捕捉下一个成功项目的关键 [1] 投资机构概况与策略 - **红杉中国种子基金**:成立于2018年,管理规模超过100亿人民币,7年来支持了400多家早期公司,其中约70%为第一轮投资,致力于成为创业者“最早的”投资人 [3] - **元禾原点**:成立12年,为元禾控股旗下早期投资平台,已投资300多个项目,主打硬科技、早期及医疗健康标签,依托国资背景与市场化结合 [4] - **峰瑞资本**:成立10年,为综合型早期基金,覆盖医疗、科技和消费,旨在赛道热起来之前进入,以对抗板块轮动周期 [5][6] - **心资本**:专注于科技与数字化领域的早期风险投资机构,团队曾投资小鹏汽车、满帮、速腾聚创等项目的早期轮次 [7] 当前重点投资方向 - **具身智能与AI硬件**:被视为重要方向,包括机器人、AI驱动的消费电子等 [8] - **AI应用与基础设施**:包括AI模型、应用、GPU、推理芯片等 [8][12] - **前沿与交叉学科**:包括AI for Science、量子科技、生物制造、核聚变、氢能、6G等“十五五”未来科技方向 [9] - **非共识与留白**:机构均保留一部分资金用于布局确定性不高、处于极早期的新兴技术和方向 [10][12] 构建认知差异的关键要素 - **投人重于投赛道**:早期投资的核心是识别优秀的创业者,例如红杉投资宇树科技主要基于对创始人王兴兴坚韧品质的认可,尽管当时行业共识不足 [14] - **长期跟踪与体系化布局**:通过长期(如5-10年)持续关注和投入,在赛道爆发前形成前瞻性认知,例如元禾原点自2011年投资江苏北人后,体系化布局了机器人及自动驾驶赛道 [16] - **穿越周期与低谷期布局**:在行业低谷期坚持投资,以便在技术拐点或市场回暖时抓住机会,例如红杉在去年市场不热时投资了外骨骼公司极壳和智能眼镜公司Even Realities [14][19] - **个性化认知模型**:投资决策如同大模型,每个人的背景、经历和过往案例(参数)不同,导致对同一创始人的评估和兴奋点截然不同 [21] 项目来源与机构影响力构建 - **红杉的全链条与孵化机制**:通过从想法阶段到IPO的全阶段布局,积极进行人才追踪和创业孵化,构建持续迭代的行业认知 [13][24] - **峰瑞资本的内容影响力**:通过创始人李丰(丰叔)的活跃输出、团队深度研究分享以及线上线下活动(如播客、美国路演)提升品牌能见度,间接促进优质项目触达 [25][26] - **心资本的思考开源**:通过运营“AI大航海”公众号(年更新5-6篇深度文章)开源关于AI的思考,旨在吸引志同道合的创业者,形成学习、投资、输出的正向循环 [26][27][28] - **元禾原点的资源融合**:作为人民币基金,学习美元基金开放打法,依托地方产业资源和国家方针引导,同时坚持市场化竞争,在硬科技领域与头部美元基金出现更多交汇与合作 [30][31] 未来投资展望关键词 - **AI全面聚焦**:机构普遍表示将大部分资金投向AI相关领域,峰瑞资本计划将70%资金投到AI上,近乎All in AI [33] - **AI基础底座**:元禾原点强调将更加注重在AI基础底座发力 [34] - **AI应用细分**:红杉中国表示将继续聚焦AI应用的各个细分领域 [34] - **投有积累的人**:心资本强调投资那些在特定领域有“10万小时积累”的创始人 [32]
一份命中率 80% 的 AI 预测复盘|拾象年度预测
海外独角兽· 2025-12-15 18:01
2025年AI行业预测复盘与格局演变 - 文章核心观点:对2025年AI行业的20个关键预测进行了复盘,大部分关于行业格局和技术路径的判断得到验证,但对技术进步、基建成熟度和AI交易复杂性的预期存在过度乐观 2026年AI领域将在争议中继续发展,World Model、多模态、机器人等方向存在积极信号,但OpenAI高达1.4万亿美元的资本支出计划也意味着市场预期已被推至高位 [2] 模型与云服务格局 - 微软投资Anthropic,结束了模型与云服务的独家绑定关系 Anthropic的Claude模型在Azure上线,OpenAI则与AWS签署了价值380亿美元的多年合作协议,并与其他云服务商合作,实现了“所有模型在所有云上”的格局 [5][6][7] 主要科技公司的竞争态势 - Google凭借TPU算力、分发渠道(Android/Chrome)和DeepMind人才优势,在2025年第四季度通过Gemini 3模型成功扭转了“AI落后者”的形象,回归“AI王者”地位 [8][9] - 科技巨头(Mag 9)凭借对云、算力、分发渠道等关键资产的掌控,在AI大规模应用时代持续受益,从收取“流量税”转向收取“基建税” [57][58][59] 操作系统与智能体竞争 - 模型公司之间的竞争演变为“操作系统”之争,拥有OS被视为最高护城河 Anthropic发布了MCP和Claude Skills,OpenAI推出了App SDK,旨在定义Agent运行标准并掌控应用分发权 [10][11] - Agent被视为运行在LLM OS上的“App”,其发展重点从知识生成转向任务生成,交互形态探索包括AI浏览器、Artifacts、Canvas和语音等 [33][34] 智能体的发展与落地 - Coding Agent是2025年的重要落地场景,实现了从IDE内联补全到“给需求、生成甚至改造整个项目”的Agentic工作流转变 Claude Code的年经常性收入突破10亿美元,Cursor的ARR和估值增长了10倍以上 [13] - 衡量Agent能力的关键指标是处理长周期任务的成功率,其任务长度正以指数级增长,大约每7个月翻一倍,预计2029年能处理时长为1个工作月的任务 [17][18] - Context Engineering成为Agent落地的核心基础设施和决定性竞争因素,其重要性超越了提示工程和RAG,旨在解决冗长上下文带来的性能瓶颈 [22][23] 算力硬件市场动态 - OpenAI o1模型开启的复杂推理需求对硬件内存带宽和互连能力要求极高,导致大量高端推理需求回流至NVIDIA生态,推动其市值在2025年内突破5万亿美元 CSP自研芯片受限于软件生态和性能,难以承接最前沿的模型工作负载 [24][25] 模型训练技术演进 - 2025年最重要的技术范式转移是算力投入从预训练侧转向强化学习规模化,后训练阶段与预训练的算力消耗量级相当,成为核心训练阶段 OpenAI为此提出了“Mid-Training”的组织形式 [26][27][28] - 合成数据在2025年未能实现技术突破,过度依赖合成数据会导致模型坍塌和特征同质化 高质量的专家策划数据变得更为关键,成为RL学习中稀缺的奖励信号燃料 [29][30] 推理模型商业化与产品形态 - 强推理模型如o1系列验证了推理规律,但其商业化受限,因为强推理并非大众需求,在ChatGPT产品中使用率不到5% 后端通过Model Router机制将复杂查询自动分发给推理模型,加速了商业化渗透 [31][32] - Chatbot的竞争基本结束,成为基础的自然语言指令入口 AI产品形态竞争转向创造Agentic工作流和探索AI原生交互 [33][34] 多模态与持续学习 - 多模态智能在2025年取得显著进展,例如Google Nano Banana Pro展现出逻辑与物理推理能力,DeepMind的Genie 3定位为通用世界模型,可从文本生成可交互3D环境 [38][39] - 持续学习与在线学习在2025年未获解决,其技术实现难度被低估,仍面临灾难性遗忘、记忆存储结构等前沿科学难题,是开启AI新范式的关键命题 [35][36][37] AI商业化与市场应用 - OpenAI在电商广告领域动作激进,探索即时结账、购物研究等功能,但广告收入超过订阅的预测仅部分验证,低估了构建广告业务的现实难度和Google的护城河 [40][41][42] - 自动驾驶公司Waymo业务持续增长,截至2025年12月每周提供超过45万次付费行程,较一年前几乎翻番,但Google并未推动其IPO,反而追加了50亿美元投资 [43][44] 行业并购与整合 - 2025年AI领域并购活跃,“收购式招聘”成为明显趋势,例如Google通过技术许可协议“截胡”Windsurf团队 但预期中的中小GPU云整合并未发生,因AI需求暴增推动其业务上涨 [45][46][49][50] 能源与AI科研 - 数据中心功耗爆炸式增长使得稳定电力供应成为稀缺资产,核电成为可靠基荷电源,获得科技大厂采购协议 美股核电板块公司在2025年涨幅远超纳斯达克100指数,最高超出368个百分点 [51][52][53] - AI+科研快速发展,各学科涌现出专属基础模型,例如Google DeepMind的AlphaGenome、Arc Institute的Evo2、微软的MatterGen等,分布在DNA序列、蛋白质设计、材料生成等多个重要模态 [54][55][56] 资本市场表现 - 美股科技板块在2025年4月经历大幅回调,从2月高点下跌近18.9%,但随后在AI投资热潮推动下恢复增长,并在第三季度创下新高 AI应用企业采纳速度在加速,例如Salesforce的AgentForce产品在半年内ARR从1亿美元增长至5.4亿美元 [61][62][63]
中信证券:OpenAI企业级AI现状与Agent发展展望
第一财经· 2025-12-15 08:15
行业现状与核心观点 - 2025年企业级AI处于场景探索阶段 用户数和流量实现高增 能力平权和人员降本价值凸显 且行业整体渗透率仍有较大提升空间 [1] - 展望2026年 以强化学习技术发展为基础的Agent主线仍将持续演进 带动AI从降本到增收打开更多应用场景 [1] 具体应用场景与商业进展 - 数据分析 代码生成 人力招聘 销售辅助 智能客服等场景需求较为清晰 [1] - 建议持续关注AI在财务 人力 销售 生产 供应链等管理软件核心模块上的商业进展 [1]