Agent
搜索文档
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
文|陆莫斯 封面来源|AI生成 如果想知道AI市场到底发展成什么样,火山引擎已经是中国市场当仁不让的风向标。 "截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。"12月18日,在人头攒动的Force大会现场,火山引擎总裁谭待宣布 了这一数字。 MaaS(模型即服务),是最直接的观察模型消耗量的指标。单论这一市场,如今火山引擎已经成为国内市场份额第一,全球也能排在第三位。 2025年中旬,云厂商争夺"AI云第一"的硝烟还未停息,到了今年最后一个月,各个大厂又端上了各个新版本——前有谷歌的旗舰模型Gemini 3、视频模型 Veo 3.1炸场,后有OpenAI的GPT-5.2紧追不舍。在国内,包括阿里、腾讯等巨头也纷纷端出了新模型的更新。 "大家可能以为这个很简单,但我们做起来也很不容易!"谭待笑着说,"现在的模型能力其实已经够强了,但是很多企业还是用不起来,问题是Agent的工 具和生态还很早期,企业做Agent迭代就会很慢。" 距离2020年火山入局云市场,已经过去了五年。彼时火山还被称为是云市场的"新军",现在,火山已经凭借大模型的东风,成为AI领域里不可忽视的力量 — ...
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:31
大模型已经从单点能力, 进入系统工程的较量。 文 | 陆莫斯 封面来源 | AI生成 如果想知道AI市场到底发展成什么样,火山引擎已经是中国市场当仁不让的风向标。 "截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。"12月18日,在人头攒动的Force大会现场,火山引擎总裁谭待宣布 了这一数字。 2025年,这一数字仅为16.4万亿 图源:火山引擎 MaaS(模型即服务),是最直接的观察模型消耗量的指标。单论这一市场,如今火山引擎已经成为国内市场份额第一,全球也能排在第三位。 2025年中旬,云厂商争夺"AI云第一"的硝烟还未停息,到了今年最后一个月,各个大厂又端上了各个新版本——前有谷歌的旗舰模型Gemini 3、视频模型 Veo 3.1炸场,后有OpenAI的GPT-5.2紧追不舍。在国内,包括阿里、腾讯等巨头也纷纷端出了新模型的更新。 如果要给2025年的AI市场概括关键词,多模态和Agent必定在榜。 这次的Force大会,火山引擎重点发布的产品,也围绕这两方面展开: 模型侧:豆包旗舰模型1.8、以及视频生成模型Seedance 1.5 pro; 围绕Agent开 ...
AI 产业速递:从字节原动力大会看国内 AI 应用落地趋势
长江证券· 2025-12-19 17:27
报告行业投资评级 - 投资评级:看好,维持 [6] 报告的核心观点 - 从火山引擎原动力大会观察到明确的下游需求爆发趋势和模型能力的持续迭代,供需共振下看好明年行业token用量再上台阶 [2][9] - 重点关注多模态(如生图、生视频)、端侧(如AI玩具、眼镜等)、Agent等赛道的应用机会 [2][9] 事件描述与数据表现 - 2025年12月18日,火山引擎举办冬季Force原动力大会,正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro,同时发布多款新产品 [2][4] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,自发布以来增长471倍,较去年同期增长超过10倍 [9] - 已有超过100家企业客户累计token使用量超过一万亿 [9] 模型能力迭代升级 - **豆包大模型1.8**:拥有更强多模态Agent能力 [9] - 升级多模态理解,单视频理解帧数从640提升至1280 [9] - 更强Agent能力,加强工具调用、长文和多轮指令遵循,同时支持OS Agent落地 [9] - 更灵活的上下文管理:支持256K,具备原生API上下文管理 [9] - **豆包视频生成模型Seedance 1.5 pro**:主要进步在于音画高精同步、支持多人多语言对白及具备影视级叙事张力 [9] 新产品与架构发布 - 全面升级AI云原生架构 [9] - 推出企业级AI Agent平台AgentKit,帮助企业打造多样的Agent,解决权限、集成等工作 [9] - 推出智能体工作站HiAgent,帮助企业管理和调度未来的数字员工 [9] - 发布多款封装完成的通用Agent,如“内容审核Agent”、“内容洞察Agent”、“客服Agent”,以降低企业特定任务的部署难度 [9] 商业模式与定价策略 - 火山引擎推出模型“节省计划”,提供阶梯折扣最高节省47% [2][9] - 模型定价思路从最初的技术调优实现单token降价,演进为根据Context区间定价,再到针对客户使用多款模型解决不同任务的习惯推出整体节省计划 [9] - 定价策略旨在使客户在token用量增大的情况下享受更优惠价格,降低创新成本 [9]
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-19 14:51
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”,但公司认为行业发展仍处早期,本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求,从而创造增量,例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP,而是会与现有载体共存互补,通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段,市场需求已存在但模型尚不完善,企业实践各具特色,这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善,公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP,本质都是由众多复杂Agent构成的集合,不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型(如Seedance 1.5 pro)的迭代标志着AI应用向更深场景发展,使AI能“看、听、说、做”,处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台,火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:GPU出货量已超过CPU,MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例,佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代(约三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署,固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此,公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]
MaaS做到第一后,火山下一步怎么走?
雷峰网· 2025-12-19 12:55
" Agent Infra 之战,被火山推上了新高度。 " 作者丨林觉民 编辑丨 Kash 云厂商突围,今天已迫在眉睫。 在市场厮杀多年,云市场早已被"钳"得窒息——难以遏止的恶性价格战、难以标品化的项目、难以规模化 的高投入商业模式,就像一个泥潭,让厂商们深陷其中。 而被市场"炒了又热,热了又炒"的大模型,会是云厂商冲破泥潭的突破口吗?许多人如此相信,但如何突 围,答案还并不明朗。 12 月 18、19 日,字节火山引擎召开了 2025 年的冬季 Force 大会,以豆包大模型 1.8、视频生成模型 Seedance 1.5 pro 等新进展,决心在行业的坚壁上砸开一条"渠",把 AI 的"活水"引进行业。 可以说,Agent 是今天 AI 实现突破的"超级共识",但怎么发展 Agent,却仍然是厂商们众说纷纭的"多 元叙事"。 Agent Infra 平台——"AgentKit",则是火山为了这场"大考"给出的答案。 今天,Agent 开发者平台不少,火山做 AgentKit 背后的逻辑是什么?这一切,或许早就可以从火山引擎 的发展史中,找到暗藏的草蛇灰线。 01 火山 MaaS 登顶 No.1,主要是抓 ...
提升Agent的可信度后,企业会多一批好用的“数字员工”吗?
36氪· 2025-12-19 08:11
随着 AI 技术从"工具化"向"自主化"严谨,智能体(Agent)正在成为企业应用大模型的重要形态。那 么,如何优化 Agent,让它变得更可信、更好用,最终能够成为企业优秀的"数字员工"? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请、RBC senior application support analyst 马可薇担 任主持人,和值得买科技 CTO 王云峰、商汤科技大装置事业群高级技术总监鲁琲、明略科技集团高级 技术总监吴昊宇一起,在AICon 全球人工智能开发与应用大会 2025 北京站即将召开之际,共同探讨如 何提升企业 Agent 的"可信度"。 部分精彩观点如下: 以下内容基于直播速记整理,经 InfoQ 删减。 定义 Agent 的技术边界 马可薇:很多人觉得 Agent 就是 Chatbot 加了几个插件。但从技术架构视角看,当系统目标从"对话"变 成"行动",你们认为技术栈上产生的最大一个质变是什么? 完整的过程包括:模型接收任务,判断应采取的行动,感知外界、接收反馈,并基于反馈不断调整规 划。这与过去单纯的 chatbot 模式有巨大差异,其技术复杂度和对生态的要求都远高 ...
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-18 23:26
除了外部独立APP的"反制",整个技术生态的成熟度也未做好迎接Agent全面接入的准备。对此,火山引擎智能算法负责人吴迪对第一财经记者表示,当前 行业对AI与Agent的探索仍处于摸索阶段。过渡阶段里,市场需求已存在,但模型尚不完善,企业实践也各具特色,这种状态预计还会持续三年左右。从生 态与第三方视角来看,行业"是否准备就绪"的核心在于Agent 工具的完善。吴迪透露,公司内部已投入大量精力,尝试将存量功能转化为Agent可识别、可 调用的工具。 谭待向记者补充称,不论是豆包AI助手还是APP等产品,本质都是由众多复杂Agent构成的集合。哪怕是搜索、垂直领域问答等不同功能,背后都对应不同 逻辑的Agent,而如今Agent待突破的两大核心挑战包括基础能力支撑与真实线上落地要求,满足健全性、运行时稳定性、弹性伸缩、数据安全等高标准。 2025年迈入尾声,海内外大模型头部厂商密集发力,包括Seedance 1.5 pro在内的多款多模态大模型更新迭代。对此,谭待分析称,多模态让大模型能像人一 样 "看、听、说、做",标志着AI应用往更深的场景走了。以前用大模型多为文字聊天,现在要让它办实事,不管是开车时的路况 ...
对话火山引擎谭待:多数人低估了火山拿下 AI 云的决心
晚点LatePost· 2025-12-18 19:58
"后发有劣势也有优势,关键是把手里的牌打好。" 文 丨 贺乾明 今年下半年,火山引擎调整 2021 年定下的千亿元年营收目标:原定 2029 年-2031 年的实现周期不 变,目标金额上调数百亿元。 当我们问 "这是谁的要求" 时,火山引擎总裁谭待说,是团队主动上调,是他们的 "务实浪漫"。多数 人低估了火山引擎拿下 AI 云的决心。 他们的信心来源,是火山引擎 MaaS(模型即服务)收入和豆包大模型能力提升都超出预期。12 月 18 日,火山引擎举办冬季 Force 原动力大会,谭待宣布,今年 12 月,豆包大模型日均 Token 处理量超 过 50 万亿,半年增长超 200%。 增长的动力不只来自字节旗下豆包、即梦等 AI 应用快速发展,还有一批外部客户在深入使用大模 型:累计使用上万亿 Token 的超过 100 家,比全球云计算巨头 AWS 还多了一倍。 "大模型能力持续提升,会解锁新场景,从而带动 Token 使用量增长。" 谭待说,比如生图、生视频的 需求过去一年随着 Seedream、Seedance 模型成熟迅速上涨。 这次大会,火山引擎又升级多款大模型。豆包基础大模型 1.8 版本, 强化多 ...
腾讯大模型团队架构调整,前OpenAI研究员姚顺雨出任要职|36氪独家
36氪· 2025-12-17 23:18
腾讯AI战略与组织调整 - 近期完成组织调整,新成立AI Infra部、AI Data部、数据计算平台部,以整合内部力量,统一模型团队[4] - 任命Vinces Yao(姚顺雨)为首席AI科学家,并兼任AI Infra部、大语言模型部负责人,其曾为OpenAI研究员,是Operator与Deep Research核心贡献者[4] - 新成立的AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设[6] 人才争夺与团队建设 - 在AI人才招聘上表现激进,2025年校招对中意人才出价高50%是基准线,最高可达2倍薪资挖人[8] - 正以加倍薪资积极挖角字节跳动等公司的顶尖AI人才[8] - 新任负责人姚顺雨已帮助混元团队从字节、阿里及多家AI初创公司招募到数位核心员工[9] 自研模型进展与成果 - 整合原有团队并调整训练目标后,成果迅速显现,于12月5日发布全新大模型HY 2.0,在推理和效率上有显著进步[10] - 整个2025年,混元团队发布了超过30个新模型,其3D模型已位居全球领先梯队[10] - 公司内部已形成共识:必须拥有不能拖后腿的自研模型能力[4][17] 市场竞争与产品化驱动 - 2024年第三季度开始感受到紧迫感,外部重要因素是字节旗下豆包日活逼近1000万,被视为产品初步站稳脚跟的分界线[14] - 决定坚定在AI助手类应用方向加大投入,必须以产品化、商业化方式竞争,并于2025年初将“元宝”应用调整至云与智慧产业事业群[15] - 借助开源模型DeepSeek,“元宝”月活在2025年初1个月内突破4000万,一度在苹果免费下载榜跃居第一,但后续增长放缓,凸显自研模型的重要性[15][17] 行业趋势与未来赛点 - 行业验证铁律:模型能力决定产品上限,对话依然是AI应用的核心形态[19] - 智能体正成为下一个竞争赛点,字节推出豆包手机将赛场推向新阶段[20] - 公司总裁刘炽平明确表示微信最终会推出一个智能体,但同时指出AI市场仍处于非常早期的发展阶段[23]
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
量子位· 2025-12-17 18:00
腾讯AI组织架构与人才引进 - 腾讯内部官宣大模型研发组织架构调整,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化大模型研发体系与核心能力 [6] - 姚顺雨加盟腾讯,出任“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [4][7] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术 [8] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [8] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦公司AI战略布局,提升研发效率 [8] 姚顺雨背景与成就 - 姚顺雨是前OpenAI研究员,拥有清华大学姚班背景和普林斯顿大学计算机博士学位,是NOI奥赛银牌得主和安徽省高考探花 [2][16] - 他是Tree of Thoughts(思维树)、ReAct等知名研究的作者,也是SWE-bench、SWE-agent等一系列研究的核心贡献者 [3][27] - 博士期间师从GPT-1第二作者Karthik Narasimhan,从事智能体方向研究,毕业后加入OpenAI [18] - 其研究工作贯穿Agent研究关键节点,包括提出CALM、WebShop等 [19] 姚顺雨的AI发展观点 - 姚顺雨在2024年8月发表博文《The Second Half》,提出AI正处在“中场休息”阶段 [21] - 他认为AI上半场以模型和方法为中心,核心是“把模型训出来”;下半场重心将转向任务定义、系统构建与评估体系 [22] - 关键问题从“能否训练模型解决XX”转向“什么问题值得被解决”以及“如何判断AI是否真的进步”,评估成为决定方向的前置条件 [23] - 真正重要的不是继续堆模型规模,而是让模型在真实任务和系统中经得起检验 [24] - 他认为Agent的本质不是“会用工具”,而是“能推理并泛化” [26] - 创业公司的最大机会不在模型,而在交互方式 [28] 腾讯AI产品与业务进展 - 过去一年,腾讯混元大模型发布了超过30个新模型 [9] - 2024年12月5日发布的混元2.0显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先 [9] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [9] - 腾讯元宝AI应用用户规模稳居国内前三,成为最受新中产欢迎的AI原生应用,上线初期保持每天一个版本的迭代频率 [10] - 腾讯将元宝的AI能力融入微信、QQ、音乐、会议等国民级产品中 [10] - 腾讯混元大模型已在内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [10] - 公司内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [10] 腾讯AI战略与行业地位 - 腾讯被认为拥有完备的AI要素:丰富场景、海量数据、生态资源,以及谋定后动的战略风格 [14] - 公司通过组织变阵、人才引进、产品(如元宝)和开源(如混元3D)等多方面举措,明显开启了AI进程上的提速 [12][13] - 引进姚顺雨这样的顶尖人才,被视为腾讯开启AI攻坚的证明 [11]