文章核心观点 - AI大模型的出现直接挑战了互联网大厂的组织架构,促使腾讯对其AI研究体系进行多次重大调整[12] - 从独立实验室模式向与业务深度整合的“大一统”模式转变是行业发展的必然趋势,腾讯AI Lab的撤销标志着实验室时代的结束和大模型时代的开始[72][73][74] - 混元大模型的发展历程充满内部竞争与组织摩擦,其发展速度受制于早期算力和数据资源的不足,如果少走弯路今天或许仍在业界第一梯队[4][28][29][66] 被裁的腾讯AI Lab - 腾讯AI Lab最终被撤销,其组织架构的演变经历了从张潼、张正友到蒋杰等不同负责人的多个阶段[13][32][33][55] - 实验室的衰落始于大规模的中层离职潮,2023至2024年间包括视觉、医疗、虚拟人、语音等多个技术中心的负责人相继离职[30] - 核心科学家俞栋的离职是AI Lab撤销的最大导火索,随着张潼、刘威、俞栋这“三剑客”全部离开,实验室最终难以为继[11][53][54] 混元的三年战争 - 混元大模型项目始于2022年底至2023年初,最初由张正友作为项目组长,联合AI Lab、机器学习平台部、数据平台部等多个虚拟组织共同研发[19] - 项目初期面临激烈内部竞争,数据平台部凭借在广告场景积累的经验,拿出了效果更好的模型,导致AI Lab在2023年5、6月间失去了后训练任务,只专注强化学习[27] - AI Lab在竞争中处于劣势,其拥有的GPU算力仅有小几千张,规模甚至比不上一个初创公司,而机器学习平台部的算力是其数倍,同时在获取PCG、WXG等关键业务数据时也屡屡碰壁[28] - 混元1.0版本最终由数据平台部主导,于2023年9月面向公众推出[27] 腾讯AI Lab往事 - 张正友接任AI Lab主任后,被赋予了更大的自由,甚至传闻总办未为其团队设置硬性KPI[14] - 2019年前后AI市场遇冷,AI Lab转向工程落地,设立产研中心,人员编制从研究中心向产研中心倾斜,引发了研究团队的不满[16][17] - 实验室的核心技术骨干包括俞栋、史树明、刘威等人,他们在张正友时代扛起了AI Lab的大旗[17][19] - 史树明在离职后自嘲“终于可以好好地学一下大模型了”,并独立完成了3.5比特量化的推理框架inferflow[30] 腾讯AI四龙治水 - 混元研发初期存在多头管理问题,张正友是项目组长,但其下属的机器学习平台部和数据平台部实际仍向TEG的蒋杰汇报,形成了“双管齐下”的局面[21] - 蒋杰接管AI Lab后推行以AI为轴心的“大一统”组织变革,但AI Lab并非其主战场[34][38][39] - 刘威在混元一役后快速晋升,但不久后因视频模型开发进展不如人意而离职创业[40] - 华为天才少年钟钊被引入接手视频与图像业务,其技术理念与刘威不同,导致刘威团队原有成员流失近80%[41][44][46] - 来自阿里的薄列峰加入后分管混元多模态模型部,稳住了该部门结构[47][49] - AI Lab后期调整为R1-R4四个以合伙人制运行的部门,合伙人包括俞栋、胡瀚、冯佳时、叶德珩[49] - 俞栋的语音团队最终被划入薄列峰治下的多模态模型部,成为其第五个板块[53] 腾讯阿里为何错失Deepmind - 文章通过腾讯AI Lab的案例,间接反映了大型科技公司在管理顶尖AI科学家、整合研究与工程以及应对技术范式快速转变方面面临的挑战[12][14][70][71] - 科学家(如俞栋)更适合带领小团队进行技术突破,而非承担高压的管理岗位,公司的管理方式需与之适配[53] - 过去的科研模式允许“花大钱办小事”,但当前AI发展要求将“多个独立方向的平行研究”收敛为“一个统一架构的工程化落地”,独立实验室模式反而造成了研究与产品之间的摩擦及资源分散[71][72] 姚顺雨时代:让AI Native的人领路 - 95后姚顺雨被任命为混元大语言模型部负责人,体现了公司希望由AI Native的年轻人带来新思路的决策[60][65] - 姚顺雨的目标是在2026年年中,将混元做到国内第一梯队[66] - 在姚顺雨治下,混元大语言模型部设有预训练、后训练、Baseline Infra、模型评估和Frontier(前沿)五大板块,其中前沿组吸纳了不少原AI Lab的科学家[61][62] - 团队正变得越来越年轻和敏捷,吸引了来自Seed、DeepSeek、Qwen、Kimi等公司的顶尖人才及名校毕业生[65]
腾讯 AI · 五问丨混元的三年战争