Workflow
阿里千问
icon
搜索文档
中国人工智能,这样揭幕“十五五”开局之年
第一财经· 2026-03-10 20:02
中国AI产业整体发展势头 - 2026开年,中国AI势头迅猛,作为“十五五”开局之年,2026年极可能是中国AI大发展的一年[3] - 国家发展改革委主任郑栅洁表示,到“十五五”末,中国人工智能相关产业规模将增长到10万亿元[3][23] - 中国企业擅长在目标明确时通过工程化能力快速推进,AI时代胜负取决于智能能力进步的速度,而速度来自研发效率[3][25][26] 国产芯片的突破与进展 - 产业界密切关注DeepSeek与国产芯片的适配情况,过去一年中国本土芯片和本土模型配合度的积极进展有目共睹[4] - 摩尔线程真正实现了万卡规模以上集群、数千亿参数规模模型的端到端训练落地,并经过客户验证,是其最大突破[6] - 摩尔线程产品迭代快,每年雷打不动有新架构及超过一款芯片产品面市,2026年基于下一代花港架构的两颗芯片将面世,承诺实现数量级的能力提升[8] - 沐曦股份自研的MXMACA软件栈已支持超6000个国际主流生态应用与超1000个模型的原生适配,用户规模已超过25万人[8] - 沐曦股份芯片迭代已提速,基本做到每两年至少推出两款芯片,2026年1月发布了专门用于科学计算的曦索X系列芯片[9] - 在一些特定作业场景,如搜推广、自动驾驶、AI4S以及图生视频等领域,国产芯片逐渐可以和国外厂商竞争[8] - 近三个月,沐曦股份均第一时间宣布对千问大模型、智谱AI、阶跃星辰等十余个国内顶尖模型进行Day 0适配[9] 国产大模型的快速迭代与成本优势 - 马年春节前后是国产大模型发布的密集期,字节跳动推出Seedance2.0,智谱发布GLM-5,MiniMax推出MiniMax-M2.5[10][11] - MiniMax在108天里更新了三款模型(M2、M2.1、M2.5),竞争推动中国大模型企业加快迭代速度[12] - MiniMax的M2.5以每秒100 token的输出速度连续工作一小时只需1美元,这意味着1万美元可以让4个智能体连续工作一年[13] - M2系列文本模型在2026年2月的平均单日token消耗量已增长至2025年12月的6倍[13] - 字节跳动的Seedance2.0支持文本、图片、视频、音频四种模态的混合输入,输出一致性大幅提高,细节在多镜头间高度一致[13] - 中国模型在使用成本上比美国模型低很多,技术底层架构的创新让中国的大模型极具性价比[14] - 国内企业在模型稀疏化、键值缓存管理、以及量化技术上做了优化,大幅降低了单位Token的显存占用和算力消耗[14] C端超级应用入口的争夺 - 春节红包大战是C端持久战的预演,字节跳动火山引擎获央视春晚独家AI云合作资格,豆包除夕当天AI互动总数达19亿次[19] - 2026年2月,豆包的月活跃用户数量暴涨至3.15亿[20] - 阿里千问春节活动实际投入已远超30亿,其日活跃用户数量一度逼近豆包[20] - 目前豆包、千问、夸克、DeepSeek、腾讯元宝在活跃用户数量方面排在中国AI的C端应用前五[20] - 头部企业(阿里、字节、腾讯)对超级入口的争夺是一场持续战争,不可能毕其功于一役[20][21] 智能体的发展与行业应用前景 - 编程是智能体在生产力场景中最早被验证的能力之一,未来在更复杂的创新性任务以及多智能体协作方面有巨大提升空间[23] - MiniMax内部已广泛部署自研智能体,辅助编程、财务、客服等环节[23] - 预计2026年办公领域将复刻去年编程领域的进步速度,办公场景是比编程更大的市场[23] - 2026年,智能体渗透率会出现大的飞跃,将出现各种拥有专业技能的智能体和智能体群,成为个人助手和企业的数字员工[23] - 物理AI作为下一波浪潮,核心是AI与物理世界实体经济的融合,面向未来的万亿级市场[24]
中国正在卷起一场OpenClaw风暴
虎嗅APP· 2026-03-07 18:19
文章核心观点 - 以OpenClaw为代表的本地AI代理(Agent)的兴起,标志着大模型竞争从“智能水平”转向“行动能力”,并可能重构用户与数字世界的交互界面,成为下一代“超级入口” [7][27] - 行业巨头(如腾讯、阿里、小米)正通过推广本地Agent,旨在解决大模型商业化的两大核心问题:一是通过高频API调用消耗算力、创造现金流;二是收集稀缺的“任务轨迹数据”以训练下一代模型 [15][17][19] - 这场竞争的本质是争夺AI时代的“意图分发权”和底层控制权,可能颠覆现有以超级App为中心的移动互联网格局 [23][24] 根据相关目录分别进行总结 卖Token的现金流 - 当前大模型行业面临商业模式困境,仅靠C端用户对话模式(“Chat”模式)消耗的Token量低,无法覆盖庞大的算力投资与运营成本 [14] - 2026年,字节、阿里、腾讯三家的合计资本支出预计将超过600亿美元,若算力闲置将产生高昂折旧 [14] - 本地部署的Agent(如OpenClaw)通过拆解并自动执行复杂任务,其单次任务的Token消耗量可达普通对话的百倍乃至千倍,成为持续消耗算力的“Token黑洞” [15] - 云厂商积极推广开源Agent(如腾讯线下“摆摊”帮用户部署),目的是将用户终端的API调用指向自家云服务,将海量微小请求汇聚成可观的B2C和B2B现金流,维系算力扩张 [15] 挖掘轨迹数据 - 大模型发展的一个关键瓶颈是高质量训练数据枯竭,尤其是反映人类在数字世界中如何“采取行动”的“任务轨迹数据” [17] - 任务轨迹数据记录了AI代理从理解需求到调用工具、完成支付等完整任务链路的每一步,比静态文本数据更有价值,是训练具备强逻辑推理和执行能力Agent模型的核心资源 [17][18] - 部署在用户终端的Agent(如OpenClaw、小米的MiclawAgent)充当“数据探测器”,在为用户自动化执行任务的过程中,默默收集用户的操作意图和软件交互轨迹 [19] - 用户在使用和纠正Agent的过程中,实际上在免费为巨头提供高质量的强化学习微调数据,这类似于特斯拉通过行驶中的车辆收集路况数据 [19] - 阿里内部人士认为,通过Agent轨迹数据快速迭代模型,是缩小与国际领先者差距的关键途径 [20] 入口战争再轮回 - AI正在重构用户与数字世界的交互界面,未来用户可能不再需要主动打开特定App,而是通过向AI Agent用一句话表达需求来完成操作 [23] - 在此体系下,App可能退化为后台的服务节点,而直接听命于用户、掌控任务分配权的Agent将成为新的超级入口 [23] - 行业巨头(如阿里推进“AI办事”,小米将Agent植入系统底层)的目标是争夺“意图分发权”,即成为控制用户需求流向的“底层代理人” [23][24] - 一旦某家公司的Agent占据用户终端,它将掌握商业导流的顶级权力,可能使现有的超级App沦为失去流量和品牌溢价的“管道” [23] 风暴前夜 - OpenClaw的流行是一个信号,表明AI正从“会说话的工具”向“会做事的系统”演进 [26][27] - 一旦AI能稳定完成任务,互联网结构可能发生根本变化,用户只需面对一个Agent即可处理大部分数字生活操作 [27] - 回顾技术史,Android、微信公众号、小程序等都从不起眼的开端演变为新平台,今天的OpenClaw可能是未来AI Agent时代的早期代表之一 [28][29] - 当前中国互联网正处于这场由Agent驱动的平台级变革的前夜 [30]
林俊旸发文告别阿里
财联社· 2026-03-07 17:08
核心人事变动 - 前阿里千问大模型核心负责人林俊旸已从阿里云离职,其辞职已于3月5日由阿里巴巴CEO吴泳铭通过内部邮件正式批准 [1] - 该离职事件于3月7日凌晨由当事人本人在朋友圈发文确认 [1] 离职背景与个人表态 - 林俊旸在发文中表达了离职时的复杂情绪,并对过往工作进行了总结,自认内心觉得“做到了为兄弟们好为阿里云好为集团好”,但也承认“很多真没做到位” [1][3] - 林俊旸在评论区进一步表示“为公司为千问,我只能做这么多啦”,并鼓励前同事“你们一定要加油啊” [1][5]
智谱最新招聘标注“某大厂某团队高优面试直通车”
第一财经· 2026-03-05 23:55
行业人才流动与竞争态势 - 阿里千问大模型技术负责人林俊旸及部分团队成员已从阿里巴巴离职 [1] - 智谱公司正积极为GLM团队进行大规模招聘,开放岗位涵盖AI基础设施、核心模型研发及应用创新等多个关键领域 [1] - 智谱公司开放的岗位具体包括Date Infra、AI Coding、Agent、GLM基座研发、GLM后训练、Infra、多模态、评测及创新方向 [1] 公司招聘策略与人才竞争 - 智谱公司在招聘海报中明确标注了“某大厂某团队的高优面试直通车”,显示出其针对特定竞争对手(如阿里巴巴)人才的有针对性吸引策略 [1] - 此次招聘覆盖了从底层基础设施到上层应用创新的全技术栈,表明公司正全面加强其大模型技术体系的建设 [1]
关于今天的政府工作报告,聊聊投资相关的十大趋势
表舅是养基大户· 2026-03-05 21:33
文章核心观点 文章基于对政府工作报告的解读,提炼出影响中长期发展的十大趋势,认为国家正将制度优势转化为发展动能,并从中揭示了多个产业升级、科技创新和结构性变化带来的投资线索 [2][3] 趋势一:安全与发展 - **安全是发展的前提**,强大的军事能力与制造业深度和AI精度高度相关 [6][7] - **制造业代表军事“深度”**,中国制造业增加值连续16年全球第一,工业体系门类齐全 [8][9] - **AI代表军事“精度”**,国产大模型引领全球开源生态,在AI五层架构中,中国在大模型方面追赶迫近,仅在芯片方面明显落后 [10] - 从投资视角看,具备强大军事能力的国家,其资产应享有系统性溢价 [11] 趋势二:应对外部冲击与保障安全 - 外部环境面临“多年少有的外部冲击挑战”,反脆弱性的核心是**粮食安全与能源安全** [13][14] - **能源安全体现在两方面**:一是主动的能源转型,非化石能源消费占比达21.7%,并推进超大规模智算集群、算电协同等新基建;二是能源进口网络的分散化 [15][16][18] 趋势三:人口老龄化应对 - 人均预期寿命已提高至**79.25岁**(1990年为68.6岁),人口老龄化是不可逆趋势 [19] - 确定性的“银发经济”将带来确定性的投资机会 [20] - 报告首次提到“完善适应人工智能技术发展促进就业创业的措施”,提示个人需适应AI带来的时代变迁 [21] 趋势四:财政范式转向“投资于人” - 今年“以旧换新”财政安排**2500亿**,较去年**3000亿**减少**500亿**,因定调“供强需弱”,财政更多转向“投资于人” [21] - 新增**1000亿**财政金融协同促内需专项资金,用于贷款贴息、融资担保等以扩内需 [21] - **2025年起全面实施育儿补贴制度**,惠及3000多万婴幼儿 [22] - 能落实“投资于人”政策及生育友好型环境的城市和企业,将享受长期品牌溢价 [25][26] 趋势五:科技自立自强 - 报告强调要“抓住新一轮科技革命和产业变革历史机遇”,**科技自立自强是长期战略** [28] - 提升生活水平需在全球分享更高附加值产业,依赖于持续的**产业升级**和**科技进步** [29][31] - **科技板块,特别是自主可控领域**,将持续成为产业与投资核心,但需注意技术路线快速变化可能带来的估值阶段性过热 [32] 趋势六:新质生产力与融合发展 - **新质生产力核心是产业、研究、金融的融合发展** [33] - 对比2025与2026年报告,持续关注的新兴产业包括:航空航天、低空经济、量子科技、具身智能、6G;**2026年新增**集成电路、生物医药、未来能源、脑机接口;2025年提及的深海科技未在2026年出现 [34] - **产研结合是优势**,企业承担研发职能,市场化竞争倒逼研发能力提升 [36] - **金融支持科技力度加大**,报告新增对关键核心技术领域科技型企业实施上市融资、并购重组“绿色通道”机制的内容 [37] 趋势七:工程师红利 - **工程师红利取代人口红利**,成为产业升级的核心竞争力 [38] - 劳动年龄人口平均受教育年限增至**11.3年** [39] - 全社会研发经费投入年均增长**10%**,其中基础研究投入占比达**7.08%**,为历史上首次破7% [41] - 工程师红利在AI、创新药、高端制造业等领域将转化为产业竞争优势,是重要投资参考 [42][43] 趋势八:消费场景创造与服务消费 - 报告提出“支持有条件的地方推广中小学春秋假,落实职工带薪错峰休假制度”,旨在创造**消费场景** [45] - 从总量看,不缺消费能力,缺的是消费场景(如时间)和能令消费者付出高价的优质供给 [45] - **服务消费的机会是长期性的**,可参考海外经验 [46] 趋势九:反内卷与出海 - **反内卷已成为政府工作主线**,将驱动企业继续“向外看” [48] - **出海成为新的蓝海**,符合国家出口多元化导向,并催生对教育、法律、金融、商会、人才等配套服务的出海需求,带来工作与投资机会 [49] - 反内卷将深入企业文化,构建“反内卷”文化的企业将获得长期品牌溢价 [50][51] 趋势十:房地产市场与生活品质 - 报告承认“房地产市场仍在调整”,但工作任务中提到推动“**安全舒适绿色智慧的‘好房子’**”建设 [52][53] - 未来,**住好房子与拥抱优质股权**是投资与生活的双主线,好房子应被视为提升生活品质的享受而非单纯投资品 [53] 其他市场观察 - 全球市场当日反弹后下午集体跳水,建议利用短期回调买入长期确定性方向 [57][58] - **南下资金单日合计卖出277亿**,创2024年以来单日新高 [60] - 利空消息包括阿里千问团队的人事震荡 [61] - **金融机构减量合并的趋势不会停止,可能加速** [55]
阿里巴巴CEO回应林俊旸离职
21世纪经济报道· 2026-03-05 13:33
阿里巴巴AI业务人事变动与战略重申 - 阿里巴巴通义千问大模型技术负责人林俊旸已正式离职 [1] - Qwen后训练负责人郁博文于同日离职,Qwen Code负责人惠彬已于1月加入Meta [1] - 公司CEO吴泳铭通过内部邮件回应,靖人将继续领导通义实验室 [2] - 公司将成立由吴泳铭、靖人、范禹共同协调的基础模型支持小组,以协调集团资源支持基础模型建设 [2] 阿里巴巴AI核心战略方向 - 公司明确发展基础大模型是面向未来的关键战略 [2] - 公司将继续坚持开源模型策略 [1][2] - 公司将持续加大对人工智能领域的研发投入 [1][2] - 公司将加大吸纳优秀人才的力度 [1][2] 其他行业动态 - 黄金消费市场活跃,有金店日销售额达到百万元级别,多家银行投资金条产品出现断货情况 [3] - 中国创新药领域交易活跃,大额订单频繁出现 [3]
AI 上游涨价延续,中国大模型调用量首超美国
国金证券· 2026-03-05 08:45
报告行业投资评级 报告未明确给出行业投资评级 报告的核心观点 AI需求旺盛,上游供给紧张,涨价蔓延,硬件、模型、应用端均呈现积极信号,今年或将是国产算力链加速向上的元年 [9] 根据相关目录分别进行总结 一、产业前沿 AI 基础层:高端 GPU供给紧张,存储、云服务等环节涨价 - 美国“星际之门”AI数据中心项目进展缓慢,OpenAI因融资困难转向重度依赖云伙伴合作模式 [13] - 全球高端GPU(如B200、A100、H100)实时可用率持续大幅下滑,创下历史新低或多年最低水平,主因市场需求激增 [14][15] - 云计算定价迎来战略转折点,亚马逊AWS部分服务涨价约15%,谷歌云上调全球数据传输价格,国内厂商优刻得宣布全系云产品与服务价格上浮 [16][17] - 存储芯片市场供给严重短缺,苹果以高价采购NAND Flash和DRAM,后者接受三星报价涨价100% [17] - 中国芯片制造商计划在两年内将尖端工艺(7nm/5nm级)芯片产量提高五倍,以满足国内AI需求,中芯国际是主要参与者 [17] AI 模型层:OpenAI融资1100亿美元,中国模型调用量首次超过美国 - OpenAI宣布获得1100亿美元新投资,公司估值达7300亿美元,投资方包括软银、英伟达和亚马逊 [18] - OpenAI与亚马逊签署战略合作协议,将在现有380亿美元多年期协议基础上,未来8年内追加1000亿美元合作规模,并共同创建有状态运行时环境 [18][19] - 2026年2月9日至15日当周,中国模型的API调用量为4.12万亿Token,首次超过美国模型的2.94万亿Token,2月16日当周中国模型调用量进一步冲高至5.16万亿Token [20] - 全球调用量前五的模型中,中国占据四席,分别为MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5以及DeepSeek V3.2 [20] - 中国模型通过采用“混合专家”架构等技术大幅降低推理成本 [21] - DeepSeek在重大模型更新前,未向英伟达、AMD等美国芯片商提供早期访问,转而与华为等国内供应商合作适配 [21] AI 应用层:Gemini和Claude活跃度上升,Anthropic推出智能体AI工具 - 海外聊天助手应用中,Gemini和Claude活跃度持续上升 [22] - Anthropic推出旨在实现人力资源、投资银行等领域工作自动化的智能体AI工具Claude Cowork [22] 二、资本风向 AI 基础层:英伟达25Q4财报良好,Meta将使用AMD、Google的AI芯片 - 英伟达2025年第四季度营收680亿美元,同比增长73%,数据中心收入620亿美元,同比增长75% [24] - 英伟达第四季度GAAP毛利率为75%,网络业务收入110亿美元,同比增长超过3.5倍 [24][25] - 英伟达给出2026年第一季度营收指引780亿美元,超市场预期 [24] - NVIDIA GTC 2026大会将首次公开下一代Feynman芯片,该芯片将搭载全球首款台积电1.6nm制程工艺 [27] - AMD与Meta签署多年协议,将提供高达6吉瓦的AI算力,协议金额或达数百亿至上千亿美元 [28][35] - Meta已与谷歌达成价值“数十亿美元”的协议,将在未来数年租用谷歌TPU开发新AI模型 [30] - 谷歌正通过金融化方式(如与投资机构成立合资公司)加速TPU外部租赁业务,目标获取相当于英伟达年收入约10%的份额(英伟达过去12个月收入约2000亿美元) [30] - 中芯国际正在研发“类5纳米”的N+3制程,已用于生产华为最新移动处理器和昇腾AI芯片 [31] - 中际旭创2025年全年收入382.40亿元,第四季度收入132.35亿元,同比增长102% [32] AI 模型层:Google推出Nano Banana2,千问位列中国企业模型市场第一 - 谷歌推出基于Gemini 3.1 Flash Image架构的Nano Banana2图像生成模型,输出分辨率提升至4K [33] - 2025年下半年,中国企业级大模型日均调用量中,阿里千问占比32.1%位列第一,较上半年17.7%的占比几乎翻倍 [33] AI 应用层:千问预计将陆续发布AI眼镜、AI指环、AI耳机等产品 - 阿里千问将在2026年世界移动通信大会上发布AI眼镜,并计划在年内陆续发布AI指环、AI耳机等产品 [35] - 阿里云Coding Plan订阅服务新增支持千问3.5、GLM-4.7、Kimi-K2.5等编程模型 [34] 三、 本周观点 - 英伟达第四季度业绩及第一季度指引均超预期 [35] - 全球算力需求持续增长,中国模型调用量首次超过美国,硬件端中国芯片制造商计划大幅扩产 [35] - 今年或将是国产算力链加速向上的元年 [9][35] 四、产业链数据更新 - 覆铜板涨价、拉货紧张程度继续升级,行业保持高景气度 [35] - 台系电子铜箔、电子玻纤布、覆铜板、PCB厂商月度营收同比增速数据更新(具体数据见图表) [36][38]
马斯克频繁为中国AI站台,真相被忽略了
虎嗅APP· 2026-03-05 08:19
文章核心观点 - 马斯克近期公开赞赏中国AI模型(如阿里通义千问Qwen3.5),其行为并非单纯的技术认可,而是为其商业帝国(包括特斯拉、xAI)在多条战线上进行的精心战略布局 [9][45] - 其战略意图分为三个层面:满足特斯拉硬件产品对高效小模型的迫切商业需求;在中国市场示好并应对竞争,同时为xAI争取算力资源并施压美国政策;利用中国AI议题打击竞争对手(如Anthropic),并争夺“技术平权”的叙事主导权 [45] 一、小模型对马斯克硬件战略的价值 - **“智能密度”是关键**:马斯克称赞阿里Qwen3.5的“智能密度”,指在有限参数内实现高智能水平,该系列最小模型仅0.8B(8亿)参数,不到GPT-4的百分之一,但能流畅对话并运行于手机等设备 [12] - **匹配特斯拉核心硬件需求**:特斯拉的Optimus人形机器人和FSD自动驾驶系统均需在本地设备运行,无法依赖云端,需要低功耗、快速推理且智能在线的小模型 [13][14] - **契合第一性原理哲学**:马斯克推崇以最少资源解决本质问题,批评硅谷“算力暴力”风气,强调物理世界(机器人、汽车)存在硬件边界(尺寸、功耗、电池),无法承载万亿参数模型 [16][17][18] - **中国小模型符合要求**:阿里Qwen3.5开源的0.8B和2B参数模型,正好踩在特斯拉所需的本地高效运行点上 [15] 二、在中国市场的商业考量与算力博弈 - **中国市场至关重要**:特斯拉在中国销量占全球三分之一以上,上海工厂是其最大生产基地,2026年计划投入超200亿美元于AI算力、机器人工厂等领域 [20] - **采用中国AI提升产品体验**:特斯拉中国分公司计划在车载语音助手中搭载深度求索和字节跳动的AI模型,因自家Grok模型在美国陷入争议,可能影响中国消费者接受度 [21][22] - **向中国市场示好**:赞赏中国AI,部分目的是为了在中国市场维持品牌亲和力,以应对可能的销量下滑 [23] - **为xAI争取算力资源施压美国**:马斯克旗下xAI与SpaceX合并后估值达1.25万亿美元,但其算力规模远小于承诺投入超1.4万亿美元的OpenAI [25] - **借中国潜力批评美国基建**:马斯克公开表示中国将在AI算力领域远超其他地区,理由是“算力的尽头是电力”,指出美国电网超50%设备运行超20年、互联互通弱、电价上涨,而中国发电量是美国的2倍,总装机量达38亿千瓦,冗余度高 [38] - **战略意图**:夸赞中国AI算力潜力,实质是向美国国内的电网老化、审批缓慢等问题施压,警告其可能导致美国在AI竞赛中落后 [26][39] 三、打击竞争对手与争夺叙事权 - **借机打击商业对手Anthropic**:当Anthropic发文指控深度求索等中国AI公司“工业级蒸馏”其技术时,马斯克第一时间出面回怼,揭露Anthropic自身曾因盗用训练数据支付15亿美元赔偿金的事实 [29][30] - **时机与利益关联**:在Anthropic发布指控前,xAI被曝与五角大楼签署协议,获准部署Grok,而Anthropic则因拒绝AI用于军事而与美国国防部关系紧张 [32][33] - **一石二鸟**:马斯克抨击Anthropic,既打击了刚刚失去军方合同的竞争对手,又通过为中国AI公司“仗义执言”收割了舆论好感,塑造了自身形象 [34][35] - **争夺“技术平权”叙事权**:马斯克将OpenAI和Anthropic描绘为试图垄断和控制AI的“新垄断者”,而将开源、低成本、易获取的中国AI塑造为“技术平权”的旗手,这与其反建制、反垄断的公众人设契合 [41][42] - **利用政策变动抢占市场**:在特朗普签署行政令将Anthropic列为国家安全供应链风险后,OpenAI和xAI迅速行动填补市场真空 [40]
阿里紧急开会,回应千问 P10 负责人离职
程序员的那些事· 2026-03-04 22:54
核心事件概述 - 3月4日凌晨,阿里千问大模型技术负责人林俊旸在X平台宣布卸任,引发行业震动,当日微博科技热搜出现多个相关话题[1] - 阿里集团CEO吴泳铭在4日下午的紧急全员会议上向千问员工确认了林俊旸在12小时前宣布离职的消息[4] - 林俊旸的离职导致Qwen团队内部出现震动,许多成员难以接受团队灵魂人物的突然出走[5] 离职过程与内部反应 - 离职导火索源于3月3日下午的一场内部会议,双方产生分歧后,林俊旸当场离开,随后正式提交辞职申请[2] - 阿里高层曾出面沟通挽留,但有通义系离职员工认为“走就走了,大概率不会挽留”,并指出实验室内部现有技术大牛实力显著在林俊旸之上[2] - 4日下午,林俊旸在朋友圈回应,表示需要休息,并鼓励Qwen团队“按照原来安排继续干”[7] 团队与行业影响 - 除林俊旸外,Qwen团队还有其他核心成员在推特上宣布离职,这些成员不愁出路,已有包括智谱AI在内的多家企业抛出橄榄枝[12] - 智谱AI创始人唐杰在相关留言区直接发出“join us”的邀请[12] 潜在的业务与组织问题 - 有观点指出,“产模分离”是阿里过去几年里最奇怪的地方,在千问App尚未独立发展时尚可接受,但现在千问App需直接与豆包、元宝等产品竞争,仍让模型团队保持例外论被认为行不通[10]
林俊旸提出离职后,阿里高管紧急答疑丨36氪独家
36氪· 2026-03-04 22:40
阿里AI团队核心人物离职引发动荡 - 2026年3月4日凌晨,阿里千问大模型技术负责人、开源核心推手林俊旸突然宣布离职,引发行业震动,团队内部情绪低落[6][12][15] - 林俊旸生于1993年,是阿里最年轻的P10之一,自2022年起接手Qwen团队,被评价为“一个人就值一亿美金”的顶尖人才[6][13][15] - 除林俊旸外,包括代码方向负责人惠彬原、后训练研究负责人郁博文、核心贡献者Kaixin Li在内的多位核心成员也相继提出离职[14][15][17] 阿里紧急召开会议回应团队调整 - 3月4日下午,阿里集团CEO吴泳铭、首席人才官蒋芳、阿里云CTO周靖人等高管紧急召开All Hands会议,回应团队质疑[7][8] - 高层定性此次调整为“团队扩张”,旨在扩充人才和资源,并承认在沟通和组织形式处理上存在不足[8] - 高层强调千问基础模型是集团“当前最重要的事情”,大模型竞争是“整个阿里集团的事”,目标“一定要超越”[9] 团队调整背后的战略与组织矛盾 - 调整前,Qwen团队拥有独立的预训练、后训练、Infra及多模态团队,林俊旸曾推动内部多模态团队融合以提升效率[11] - 本轮调整计划将Qwen团队按技术维度拆分,与通义实验室其他团队(如万相、百聆)合并,但因沟通不足引发矛盾[11] - 此次动荡源于公司AI战略快速变化与基础模型团队目标出现差距,核心成员对资源投入和模型路线选择存有疑问[7][22] 阿里AI的资源困境与竞争压力 - Qwen团队在资源远少于竞争对手的前提下取得成绩,团队仅100多人,算上通义实验室整体为数百人规模[7][23] - 作为对比,字节跳动负责基础模型训练的Seed团队已近2000人,阿里在算力、Infra建设和招聘名额上均感捉襟见肘[9][23] - 自2023年以来,Qwen家族累计开源超过400个模型,涵盖0.5B到235B参数规模,但支撑更新的主力团队规模有限[23] 阿里的开源战略与商业挑战 - 阿里通过早期、坚定的开源战略,使Qwen成为“开源模型第一家族”,建立了良好的开发者生态和口碑[13][21] - 开源模型服务了阿里云生态,通过企业选用和购买模型服务间接转化为商业收入,但商业逻辑难以量化[21] - 在闭源旗舰模型方面,阿里2025年发布的Qwen 3/3.5系列虽处第一梯队但已有吃力之势,面临来自字节、腾讯等对手的激烈竞争[21][23] 后续人事安排与行业影响 - 接替林俊旸后训练工作的新成员是来自Google DeepMind的周浩,他曾在Meta工作3年,是Gemini 3.0模型的核心贡献者[16][18] - 林俊旸的离职在AI社区引起巨大轰动,海外开发者纷纷表达感谢,有投资人认为核心团队离开可能导致Qwen模型发展延误半年到1年[12][15] - 截至文章发布,阿里巴巴高层仍在与林俊旸密切沟通,其最终去向尚未确定[16]