AI管理难题
搜索文档
林俊旸离职风波始末:AI 技术负责人与大公司的成长与分歧
晚点LatePost· 2026-03-06 20:28
阿里Qwen团队负责人林俊旸离职事件 - 核心事件:阿里Qwen团队负责人林俊旸于3月3日突然提出离职,并在社交媒体公开意向,引发公司管理层紧急讨论[2] - 公司反应:阿里管理层认为此举“不可接受”,挑战了公司“升和降都由公司决定”的组织制度,并于3月5日正式批准其离职[2][8] - 后续影响:事件引发外部公司及猎头对Qwen团队成员的争抢,Google DeepMind等公司高管公开邀请Qwen成员加入[10][11] Qwen团队调整与内部沟通 - 调整背景:在阿里年度绩效评估前,管理层与林俊旸沟通了Qwen团队重组计划,拟从垂直整合体系改为按预训练、后训练、文本、图像、语音等划分的水平团队[4] - 人事变动:前DeepMind资深研究员周浩已于2026年1月加入阿里并参与管理Qwen后训练团队,但此事此前未同步给Qwen团队[5] - 团队会议:3月4日,阿里CEO吴泳铭、CPO蒋芳、CTO周靖人紧急召开Qwen全员会,回应团队关切,承诺加强沟通与资源支持[6][7] Qwen团队的发展历程与战略定位 - 团队起源:Qwen团队脱胎于达摩院智能计算实验室的M6项目,2023年初与NLP团队“赛马”时,起步各有约500~1000张GPU算力资源[12] - 团队规模:Qwen目前有100多名成员,其所在的整个通义实验室有600多人,而字节跳动的模型研发团队Seed则超过1500人[13] - 战略支持:团队曾获得相对独立的发展空间,其开源策略得到了CEO吴泳铭和CTO周靖人的自上而下的支持[13] Qwen的技术成果与行业影响 - 开源影响力:截至2024年10月,Qwen系列大模型的衍生模型数量达到8万多个,超过了更早开源的Meta Llama系列[14] - 行业应用:Qwen系列模型受到中小创业公司和研究机构喜爱,被Cursor等知名公司用于微调,也是一众中国具身智能公司的基模选择,DeepSeek、字节跳动也在部分研究中使用其小尺寸模型[15] 团队与公司战略的张力 - 战略分叉:2025年,随着阿里集团重点推进千问App并关注AI云商业化,Qwen团队“持续训练出更强、更高效的模型”的目标与集团战略出现分歧[15][16] - 资源与协同问题:Qwen团队反映其模型(如Qwen 3)的Coding能力欠佳与训练资源不足有关,同时团队对支持千问App及阿里云其他业务的优先级不高,引发内部不满[7][16] - 内部竞争与冗余:Qwen扩展至图像、音频等多模态领域,与同实验室的通义万相、百聆业务存在重合[16] 近期模型研发遇到的挑战 - 研发波折:2025年至今发布的Qwen 3系列和Qwen 3.5系列训练过程遇到波折,部分核心能力指标不突出[16] - 产品延期:原计划节前发布的旗舰版Qwen 3.5 Max未能就绪,除夕开源的Qwen 3.5 Plus被一位阿里高层视作“半成品”[17] AI行业的管理共性难题 - 核心矛盾:大公司强调组织、流程与集体目标的战略执行力,与AI一线研究员聪明、自驱、有创造力和野心的个体特性之间存在张力[22][23] - 普遍压力:主要AI公司普遍面临多重压力,包括驱动用户增长、承担昂贵的GPU成本以及争夺模型排名第一[23] - 管理反思:事件引发公司对高管个人社交媒体账号管控及平衡技术理想与业务协作的思考[23][24][25]