字节大模型的收敛之年

公司战略与组织调整 - 2025年字节跳动大模型业务进入“吴永辉时间”，战略从快速突击转向深度整合与长期主义 [1] - 新任负责人吴永辉上任后，取消了Seed团队的季度及半年OKR考核，以摆脱“小步快跑”模式在大模型领域的不适用性 [1][2] - 2025年初公司内部存在严重的“大公司病”，AI Lab、Seed团队、视觉生成团队、豆包产品技术部四支队伍资源分散、隐性竞争 [3][4] - 公司于2025年进行了三次关键的组织收敛：3月将AI Lab并入Seed；年中将视觉多模态团队纳入Seed体系；10月将豆包技术负责人朱文佳的汇报线调整至吴永辉 [5][6] - 此次整合是公司为数不多以“收敛”而非“扩张”为核心目的的组织调整，旨在打造统一、粗壮的“技术主干” [7][8] - 公司鼓励基础研究，2025年上半年Seed团队在国际顶级学术会议发布的论文数量较2024年同期翻倍增长 [8] - 公司核心目标从“探索智能上限”转变为“勇攀高峰”和“AI模型能力要做到行业前列”，体现了从参与者向第一梯队甚至唯一领导者转变的决心 [9] 产品能力演进与用户策略 - 2025年上半年，豆包产品存在“聊天机器”与“办事助理”之间的能力鸿沟，公司选择通过提升“听懂人话”和“把事办成”能力来填补 [10] - 2025年11月，豆包上线支持同一音色流畅切换四种方言（粤语、四川话、东北话、陕西话）并能识别20种方言的语音功能，旨在服务中国超过10亿的方言用户，争夺“下一个10亿用户” [10][11] - 公司通过发展Agent（智能体）能力提升产品“行动力”：2025年6月发布的豆包1.6版本可实现拍照整理表格、自动操作浏览器预订酒店；12月发布的1.8版本可实现跨平台比价等复杂任务 [12] - Agent能力的提升带来了成本挑战，其单次任务消耗的Token是普通聊天的几十倍，降低成本成为大规模推广的关键 [13] 技术架构与成本优化 - 2025年11月，火山引擎宣布逐步停止服务十余款2024年发布的旧版本模型，引导用户迁移至最新的Seed系列模型，这是公司当年最激进的关键动作之一 [14][15] - 公司坚决推动模型版本统一，旨在清除多套技术架构并存带来的“技术债”，避免未来调用量指数级增长时成本窟窿扩大，并重构商业模式 [16][17] - 公司通过“算力精算”构建成本优势，核心解决“快车等慢车”造成的算力浪费问题 [17] - 2025年6月，豆包1.6版本推出“区间定价”策略，0-32K输入区间的价格降至0.8元/百万tokens，综合成本比1.5版本和DeepSeek R1降低63% [18] - 更深层的优化逻辑是“PD分离”，即将文本处理的“预填充”与“解码”阶段拆解并用不同硬件处理，大幅提升效率 [18] - “旧模型大下架”是达成“降价99%”目标、发起“成本战争”的必要前提，统一的架构使得优化只需做一遍，边际成本得以持续下降 [19] - 成本策略成效显著：豆包日均Token调用量从2025年5月底的16.7万亿增长至12月的超过50万亿，较2024年同期增长超10倍 [21] - 2025年上半年，火山引擎在中国公有云大模型服务市场份额达到49.2%，通过清除技术债获得了结构性成本优势 [21] 研发节奏与市场定位 - 公司形成了以春节为锚点的“研发倒逼机制”，按春节倒排工期，将年度重磅发布集中在春节前后，旨在建立自身的行业节奏和领先优势 [22][23] - 2026年春节，公司通过成为春晚独家AI云合作伙伴、发布豆包2.0及多模态能力升级，集中展示了2025年组织、技术、成本优化的成果，从“缺席者”转变为“造浪者” [23] 行业竞争与未来挑战 - 在开源策略上，字节跳动是中国大厂中唯一坚持闭源路线的公司，而阿里、百度、腾讯均在2025年有不同程度的开源动作 [25] - 公司的闭源模式依赖于火山引擎To B服务收入与豆包To C用户黏性能持续反哺研发，形成正向循环 [26] - 固定以春节为研发节点存在风险，若发布被对手狙击或产品不及预期，将付出巨大代价 [27] - 面临强劲的竞争对手：腾讯重组AI Infra部并拥有微信12亿用户的超级入口；阿里云在开源生态和云服务领域根基深厚；DeepSeek作为创业公司仍具创新潜力 [28][29][30]