字节大模型的收敛之年
36氪·2026-02-12 17:58

公司战略与组织调整 - 2025年字节跳动大模型业务进入“吴永辉时间”,战略从快速突击转向深度整合与长期主义 [1] - 新任负责人吴永辉上任后,取消了Seed团队的季度及半年OKR考核,以摆脱“小步快跑”模式在大模型领域的不适用性 [1][2] - 2025年初公司内部存在严重的“大公司病”,AI Lab、Seed团队、视觉生成团队、豆包产品技术部四支队伍资源分散、隐性竞争 [3][4] - 公司于2025年进行了三次关键的组织收敛:3月将AI Lab并入Seed;年中将视觉多模态团队纳入Seed体系;10月将豆包技术负责人朱文佳的汇报线调整至吴永辉 [5][6] - 此次整合是公司为数不多以“收敛”而非“扩张”为核心目的的组织调整,旨在打造统一、粗壮的“技术主干” [7][8] - 公司鼓励基础研究,2025年上半年Seed团队在国际顶级学术会议发布的论文数量较2024年同期翻倍增长 [8] - 公司核心目标从“探索智能上限”转变为“勇攀高峰”和“AI模型能力要做到行业前列”,体现了从参与者向第一梯队甚至唯一领导者转变的决心 [9] 产品能力演进与用户策略 - 2025年上半年,豆包产品存在“聊天机器”与“办事助理”之间的能力鸿沟,公司选择通过提升“听懂人话”和“把事办成”能力来填补 [10] - 2025年11月,豆包上线支持同一音色流畅切换四种方言(粤语、四川话、东北话、陕西话)并能识别20种方言的语音功能,旨在服务中国超过10亿的方言用户,争夺“下一个10亿用户” [10][11] - 公司通过发展Agent(智能体)能力提升产品“行动力”:2025年6月发布的豆包1.6版本可实现拍照整理表格、自动操作浏览器预订酒店;12月发布的1.8版本可实现跨平台比价等复杂任务 [12] - Agent能力的提升带来了成本挑战,其单次任务消耗的Token是普通聊天的几十倍,降低成本成为大规模推广的关键 [13] 技术架构与成本优化 - 2025年11月,火山引擎宣布逐步停止服务十余款2024年发布的旧版本模型,引导用户迁移至最新的Seed系列模型,这是公司当年最激进的关键动作之一 [14][15] - 公司坚决推动模型版本统一,旨在清除多套技术架构并存带来的“技术债”,避免未来调用量指数级增长时成本窟窿扩大,并重构商业模式 [16][17] - 公司通过“算力精算”构建成本优势,核心解决“快车等慢车”造成的算力浪费问题 [17] - 2025年6月,豆包1.6版本推出“区间定价”策略,0-32K输入区间的价格降至0.8元/百万tokens,综合成本比1.5版本和DeepSeek R1降低63% [18] - 更深层的优化逻辑是“PD分离”,即将文本处理的“预填充”与“解码”阶段拆解并用不同硬件处理,大幅提升效率 [18] - “旧模型大下架”是达成“降价99%”目标、发起“成本战争”的必要前提,统一的架构使得优化只需做一遍,边际成本得以持续下降 [19] - 成本策略成效显著:豆包日均Token调用量从2025年5月底的16.7万亿增长至12月的超过50万亿,较2024年同期增长超10倍 [21] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额达到49.2%,通过清除技术债获得了结构性成本优势 [21] 研发节奏与市场定位 - 公司形成了以春节为锚点的“研发倒逼机制”,按春节倒排工期,将年度重磅发布集中在春节前后,旨在建立自身的行业节奏和领先优势 [22][23] - 2026年春节,公司通过成为春晚独家AI云合作伙伴、发布豆包2.0及多模态能力升级,集中展示了2025年组织、技术、成本优化的成果,从“缺席者”转变为“造浪者” [23] 行业竞争与未来挑战 - 在开源策略上,字节跳动是中国大厂中唯一坚持闭源路线的公司,而阿里、百度、腾讯均在2025年有不同程度的开源动作 [25] - 公司的闭源模式依赖于火山引擎To B服务收入与豆包To C用户黏性能持续反哺研发,形成正向循环 [26] - 固定以春节为研发节点存在风险,若发布被对手狙击或产品不及预期,将付出巨大代价 [27] - 面临强劲的竞争对手:腾讯重组AI Infra部并拥有微信12亿用户的超级入口;阿里云在开源生态和云服务领域根基深厚;DeepSeek作为创业公司仍具创新潜力 [28][29][30]

字节大模型的收敛之年 - Reportify