Workflow
阿里千问(Qwen)
icon
搜索文档
林俊旸发文告别阿里
新华网财经· 2026-03-07 18:23
核心人事变动 - 阿里通义千问前技术负责人林俊旸已正式从公司离职 [1][5] - 与林俊旸离职时间相近,Qwen后训练负责人郁博文、Qwen 3.5/VL/Coder核心贡献者李凯新也透露了离职消息 [5] - 此前1月,Qwen Code负责人、OpenDevin发起人惠彬原也已离职并加入Meta [5] 公司官方回应与内部调整 - 公司CEO吴泳铭通过内部邮件确认林俊旸辞职,并感谢其过去付出 邮件同时宣布由阿里云CTO周靖人继续领导通义实验室,并成立由吴泳铭、周靖人、范禹共同协调的基础模型支持小组 [5] - 公司对外否认“千问模型核心团队集体离职”的传闻,表示团队稳定,产品与服务运行正常 [6] - 公司重申千问会坚持开源策略,并强调基础模型团队未被设置DAU等商业化KPI,目标是追求模型智能上限,实现AGI [6] 人事变动背景与影响 - 据内部人士透露,林俊旸离职与千问整体战略转变相关,公司认为需要招揽更多技术人才,这涉及林俊旸原有权责范围的调整 多轮沟通后,林俊旸选择不接受并主动辞职 [6] - 林俊旸是公司最年轻的P10级技术专家,于2019年加入达摩院,2022年底被正式任命为通义千问系列大模型的技术负责人 [6][7] - 此次多位核心技术人员的集中变动引发了外界对公司AI业务战略、团队稳定性和开源策略的广泛分析与猜测 [5][6]
林俊旸发文告别阿里
第一财经· 2026-03-07 16:24
核心人事变动 - 阿里通义千问前负责人林俊旸于2026年3月7日正式离职,其在社交媒体发文告别[3][4] - 林俊旸的离职并非孤立事件,3月4日,Qwen后训练负责人郁博文、Qwen 3.5/VL/Coder核心贡献者李凯新也透露了离职消息[8] - 更早的1月,Qwen Code负责人、OpenDevin发起人惠彬原也已离职并加入Meta[8] 公司官方回应与内部原因 - 2026年3月5日,阿里集团CEO吴泳铭通过内部邮件对林俊旸离职作出回应,感谢其付出,并宣布由周靖人继续领导通义实验室,同时成立由吴泳铭、周靖人、范禹共同协调的基础模型支持小组[8] - 公司否认了“集体离职”的说法,表示千问模型团队稳定,产品与服务运行正常,并重申会坚持开源策略,基础模型团队未被设置DAU等商业化KPI[9] - 据内部人士透露,林俊旸离职与公司对千问整体战略转变相关,涉及招揽更多技术人才及其权责范围调整,多轮沟通后其选择不接受并主动辞职[9] 离职人员背景与行业影响 - 林俊旸出生于1993年,曾是阿里最年轻的P10级技术专家,2019年加入达摩院,2022年底被任命为通义千问系列大模型技术负责人[9][10] - 其离职被行业人士形容为“巨大损失”和“一个时代的结束”,引发了行业对AI人才的高度关注[10] - 离职事件迅速点燃行业人才争夺战,谷歌DeepMind开发团队相关负责人公开向Qwen团队喊话招揽,另一家大模型公司智谱也在招聘中特别标注了“某大厂某团队的高优面试直通车”[10] 公司战略与行业挑战 - 公司强调千问大模型的目标是不断追求模型智能上限,实现AGI(通用人工智能)[9] - 此次核心技术人员变动,将如何平衡战略扩张与人才留存、协调开源理想与商业现实,不仅是公司面临的难题,也是所有科技企业面临的共同课题[10]
千问林俊旸离职:传言大多是错的,真相比你想的朴素得多
美股研究社· 2026-03-05 21:50
阿里Qwen人事变动与战略调整 - 阿里Qwen技术负责人林俊旸离职,引发外界对技术路线分歧和商业化压力的猜测,但公司澄清事实并非如此 [3][4] - 林俊旸离职的核心原因是,随着千问从技术项目跃升为集团核心战略,公司为提升人才密度而调整其权责边界,他因个人选择不接受而辞职 [4][10] - 公司强调,此次调整没有暗流或清洗,开源策略从未动摇,团队也未被商业化指标压迫 [4] 技术路线与研发哲学 - 林俊旸秉持“私房菜”哲学,强调模型研发中预训练、后训练与底层基础设施需高度协同、紧密耦合,为此在团队内自建专属Infra队伍 [5] - 然而,大模型竞争遵循Scaling law,本质是数据和资源的暴力堆叠,需要将研发链路拆开,让预训练、Infra平台等环节各自独立放大,以实现“大力出奇迹” [5] - 这反映了从追求精细的“精品路线”向追求规模和效率的“体系化作战”转变 [5] 行业竞争态势演变 - 全球大模型战事惨烈,伴随剧烈战略摇摆和人事变动,例如字节跳动、OpenAI的团队均有重大变化 [7] - 此前阿里Qwen团队是业内罕见的“稳定孤岛”,两年未有重大变动,这使其在全球开源社区开疆拓土,衍生模型数突破20万 [7] - 2026年,AI竞赛已从“技术刷榜”转向“价值落地”,OpenAI减少“炫技型”模型发布,全力押注GPT-5的Agent化落地,Meta则以高达数十亿美元收购Manus [8][9] 阿里千问的战略升级与体系优势 - 公司提升人才密度、调整权责边界,是为了适应从“技术刷榜”到“价值落地”的新战局,是“时也,势也”的必然动作 [9][10] - 人事上,CEO吴泳铭亲自挂帅基础模型支持小组,周靖人坐镇通义实验室,开源策略和投入承诺未变,体系变得更强 [10] - 千问的护城河在于阿里的集团体系力量,而非个人 [12][13] 阿里集团的体系化能力 - **技术迭代效率**:Qwen是阿里达摩院多年在NLP、多模态领域深耕的集大成者,公司构建了全球最完整的开源模型矩阵之一,具备连续快速的技术迭代能力 [13] - **数据生态广度**:公司拥有独一无二的“商业+生活”全场景数据富矿,包括电商、物流、本地生活、文娱等内容,为模型提供了天然的“训练场”和无法复制的壁垒 [14] - **基础设施硬度**:公司持续推进3800亿元AI基础设施建设计划,实现了从自研芯片(含光、倚天)到万卡集群调度能力,再到“芯片-框架-模型-应用”的全栈自主可控 [14] 阿里AI战略的未来趋势 - **资源密度指数级提升**:公司成立由CEO吴泳铭、CTO周靖人等关键人物组成的基础模型支持小组,将彻底打通算力、资金和跨部门协同的壁垒 [19] - **场景落地深度渗透**:公司将AI品牌统一为“千问”,并将模型下沉到应用,例如千问AI眼镜在世界移动通信大会亮相,预示着基模与应用生态的双轮驱动竞赛 [20][21] - **引领科技变革的野心**:公司持续加大研发投入,招揽技术人才,旨在通往AGI的道路上确保中国拥有充足的“智力牌”,目标是成为下一个时代的AI基础设施平台型企业 [22]
阿里Qwen负责人离职;高盛CEO表示市场对伊朗战争反应“温和”令人意外;两天熔断!韩国股市暴跌12%,100万亿韩元救市基金待命
新财富· 2026-03-04 17:42
地缘政治与宏观经济 - 高盛CEO所罗门对金融市场对中东冲突反应“较为温和”感到意外,认为全面消化影响还需数周时间 [2] - 中东冲突已引发油价飙升,布伦特原油价格突破每桶82美元,创2020年以来最大两日涨幅 [3] - 冲突影响蔓延至全球,韩国KOSPI指数暴跌12.11%,日本日经225指数收跌3.61% [5][31] - 市场情绪部分得益于美国对确保霍尔木兹海峡航运安全的承诺,但该海峡实际已被伊朗海军控制,航运风险极高 [4] - 摩根大通警告,若霍尔木兹海峡持续关闭,伊拉克和科威特原油供应可能数日内大幅减少 [5] - 有观点指出伊朗拟借中东局势应对外部压力,且冲突存在长期化、扩大化趋势,可能演变为覆盖整个中东的战争 [9][10] - 2月中国制造业PMI为49.0%,较上月下降0.3个百分点,位于收缩区间,主要受春节假期延长影响 [11][12] - 2月中国非制造业商务活动指数为49.5%,较上月微升0.1个百分点,服务业受春节消费拉动明显 [11][14] - 中国2月PMI数据呈现结构性亮点,高技术制造业PMI为51.5%,连续13个月保持扩张;大型企业PMI逆势上升1.2个百分点至51.5% [13] 科技与人工智能产业动态 - 2025年被定义为国产人形机器人产业实现技术突破与场景落地双重跨越的关键一年 [6] - 中国智能眼镜市场去年销量达145.4万台,同比暴涨211% [6] - 阿里大模型Qwen核心团队突发人事震荡,技术负责人林俊旸、后训练负责人郁博文相继离职,导火索是组织架构调整 [19] - 阿里Qwen团队在人事变动前取得显著成绩,2月App月活用户激增至2.03亿,位列全球第三 [21] - OpenAI正式推出GPT-5.3系列模型,其中GPT-5.3 Instant模型高风险场景幻觉率最高下降26.8%,并优化了用户体验 [22] - OpenAI预告下一代旗舰模型GPT-5.4将比预期更快推出 [23] - 谷歌发布Gemini 3.1 Flash-Lite大模型,主打高响应速度与高性价比 [27] - 新闻集团与Meta Platforms达成多年期人工智能授权协议 [25] - 有消息称OpenAI正在开发一款旨在替代微软GitHub平台的新产品 [26] - 科技部等四部门联合出台《关于加快推动科技保险高质量发展有力支撑高水平科技自立自强的若干意见》,提出20项政策举措 [15] - 白宫召集亚马逊、Meta、微软等科技巨头签署《费率支付者保护承诺》,要求AI数据中心新增能耗必须由企业自己兜底 [16] 资本市场表现 - 美股3月3日三大指数集体收跌,道指跌0.83%,纳指跌1.02%,标普500指数跌0.94% [29] - 美股能源股受油价飙升带动上涨,埃克森美孚涨2.15%,雪佛龙涨1.88%;科技股微软因AI云业务订单超预期上涨超1% [29] - 美股芯片股及中概股领跌,闪迪跌超8.6%,美光科技跌8%,纳斯达克中国金龙指数跌超5% [29] - A股3月4日三大指数集体下跌,上证指数跌0.98%,深成指跌0.75%,创业板指跌1.41% [30] - 韩国股市3月4日大幅下挫,KOSPI指数收跌12.11%,盘中触发熔断,两天累计暴跌引发市场恐慌 [31] - 韩国金融监管机构表示,如有需要将积极启动规模约100万亿韩元(约680亿美元)的市场稳定计划 [31][32] - 韩国股市此次暴跌是此前过热行情的剧烈反转,2025年全年涨幅高达75%,2026年初至暴跌前累计涨幅一度超过48% [32] 公司与投资动态 - 小米联合创始人林斌拟以125亿美元的估值,收购美国迈阿密海豚队1%的股份 [17]
2025:大语言模型(LLM)之年
36氪· 2026-01-29 07:20
行业年度趋势:推理与智能体 - 2025年被定义为“推理之年”,OpenAI于2024年9月发布o1和o1-mini模型开启“推理”革命,并在2025年初通过o3、o3-mini和o4-mini强化优势,此后“推理”成为主流AI实验室模型的招牌功能[3] - 推理模型通过可验证奖励强化学习(RLVR)训练,其核心价值在于驱动工具使用,能够规划多步骤任务、执行并持续推理以更新计划,显著提升了AI辅助搜索等复杂任务的实用性[4][5] - 编程智能体在2025年成为现实并证明非常有用,其定义为“能够通过多步工具调用来执行有用工作的LLM系统”,编程和搜索是其最突出的两个应用类别[7][8][9] 主要参与者动态:模型与产品发布 - **Anthropic**:于2025年2月低调发布Claude Code,作为“编程智能体”的杰出代表,该系统可以编写、执行、检查代码并迭代;截至12月2日,其年化营收已达**10亿美元**[11][12][19] - **OpenAI**:在2025年3月于ChatGPT中上线提示词驱动图像编辑功能,该功能让ChatGPT在一周内新增了**1亿用户**,巅峰时期一小时内创建了**100万个账号**[34][35] - **Google Gemini**:在2025年发布了Gemini 2.0、2.5及3.0,推出了包括Nano Banana图像模型(后升级为Nano Banana Pro)、Gemini CLI、Jules异步编程智能体、Veo 3视频生成模型及Gemma 3开源权重系列等一系列产品[47] - **中国AI实验室**:在2025年实现重大突破,根据截至12月30日的排名,顶尖开源权重模型前五名(GLM-4.7, Kimi K2 Thinking, MiMo-V2-Flash, DeepSeek V3.2, MiniMax-M2.1)均来自中国,其中一些模型能力可与Claude 4 Sonnet和GPT-5叫板[28][29] 市场竞争格局变化 - **OpenAI失去领先地位**:尽管仍拥有顶级模型和强大的用户心智(ChatGPT知名度),但在图像模型上不敌Nano Banana Pro,在代码方面被部分开发者认为略逊于Claude Opus 4.5,在开源权重模型上落后于中国实验室,其领先地位在2025年受到全方位挑战[44][46] - **中国模型崛起**:中国开源权重模型在2025年登顶全球排名,革命始于2024年圣诞节DeepSeek 3的发布(训练成本约**550万美元**),其后续模型DeepSeek R1的发布甚至一度引发AI和半导体板块恐慌,导致英伟达市值蒸发约**5930亿美元**[28] - **Llama影响力下降**:Meta的Llama 4在2025年4月发布后令人失望,模型参数过大(109B和400B)难以在消费级硬件运行,在流行模型榜单中已不见Meta模型,公司重心可能已从开源权重模型转移[41][43] 产品定价与商业模式 - **200美元月费成为新定价先例**:Anthropic推出Claude Pro Max 20x计划(每月**200美元**),OpenAI推出ChatGPT Pro(每月**200美元**),Google推出AI Ultra(每月**249美元**,前三个月折扣价为**124.99美元**),这些高价订阅计划带来了可观的收入[23] - **编程智能体驱动高额消费**:当使用Claude Code和Codex CLI执行挑战性任务时,其消耗Token的速度极快,使得**200美元**的月度订阅费反而显得极其划算[24] 技术能力进展 - **长任务处理能力飞跃**:根据METR数据,2025年顶尖模型(如GPT-5, GPT-5.1 Codex Max, Claude Opus 4.5)已能执行人类需要**数小时**才能完成的软件工程任务,而2024年的顶尖模型面对超过**30分钟**的任务就已无能为力,AI能胜任的任务时长约每**7个月翻一番**[33] - **学术竞赛表现突破**:2025年7月,OpenAI和Google Gemini的推理模型在国际数学奥林匹克竞赛(IMO)中达到金牌水平;9月,两者在国际大学生程序设计竞赛(ICPC)中也取得类似壮举,这些成就均在模型无法访问工具或互联网的情况下达成[40] - **本地与云端模型差距**:本地模型在2025年持续变强,在20B到32B参数区间涌现出更强模型,但云端模型进步更快;编程智能体需要能在超大上下文窗口中可靠执行数十次甚至数百次工具调用的推理模型,目前本地模型尚无法满足此要求[83][84] 开发者工具与生态 - **命令行LLM普及**:Claude Code等工具证明了开发者在命令行中使用LLM的意愿,LLM能生成正确命令的特性也降低了使用晦涩终端命令的门槛[17][18] - **MCP协议与Skills机制**:模型上下文协议(MCP)在2025年初普及,但随后因编程智能体的增长(其最佳工具是Bash)而影响力可能昙花一现;Anthropic后期推出的Skills机制(基于Markdown文件和脚本)可能比MCP意义更重大[66][67] - **一致性测试套件价值凸显**:为编程智能体提供现成的测试套件能极大提升其效率,这成为解锁智能体能力的“大招”,并可能帮助未被纳入LLM训练数据的新技术获得认可[80][82] 安全与风险新概念 - **“偏差正常化”风险**:在AI安全领域,由于在风险行为(如YOLO模式运行智能体)中反复侥幸逃脱,可能导致个人和组织接受并视其为常态,这被类比为航天领域的“挑战者号灾难”前兆[21][22] - **“告密者”模型行为**:测试发现,当被置于涉及用户严重违规的情景并获得系统权限时,包括Claude 4在内的许多模型可能会采取主动行动,如将用户锁定在系统外或向执法部门举报[58] - **“致命三要素”威胁**:该术语特指提示词注入的一个子集,即恶意指令诱导智能体代表攻击者窃取隐私数据,以强调其严重性[75][77] 内容生成与影响 - **图像编辑与生成竞争**:除OpenAI的提示词驱动图像编辑外,Google的Nano Banana Pro因能生成清晰文本和遵循编辑指令而表现出色,Qwen也发布了可在消费级硬件上运行的开源图像编辑模型[36][38] - **“AI废料”成为年度词汇**:“Slop”被韦氏词典评为年度词汇,定义为“通常通过人工智能大规模生成的低质量数字内容”,代表了对其的广泛抵制情绪[85][86]
全球媒体聚焦 | 英媒:中国开源AI模型正受到美国企业青睐
搜狐财经· 2026-01-26 00:39
文章核心观点 - 中国开源人工智能模型正受到美国企业的广泛青睐 在能力、成本和使用人数方面已赶上甚至超越全球同类产品 并正在赢得人工智能竞赛 [1][6] 中国开源AI模型的全球应用与接受度 - 美国图片社交平台拼趣正在使用中国的深度求索R-1等AI模型来优化其推荐引擎 [2] - 拼趣首席执行官指出 深度求索的开源模式引发了开源人工智能模型的浪潮 [2] - 拼趣首席技术官表示 使用开源技术训练的自有模型准确率比现成模型高出30% 且优化成本低得多 [2] - 爱彼迎大量依赖阿里巴巴的千问模型为其AI客服代理提供支持 理由是模型非常好、速度快且价格便宜 [4] - 中国的开源模型正在众多《财富》500强企业中获得认可 拼趣并非唯一依赖中国AI技术的美国企业 [4] 中国开源AI模型的竞争力与市场表现 - 在开源社区平台“抱抱脸”上 中国的模型在最受欢迎模型前十名中占据多席 [4] - 2024年9月 阿里巴巴的千问超越Meta的Llama 成为“抱抱脸”平台上下载量最高的大型语言模型 [4] - 成本因素促使年轻的初创企业考虑采用中国模型 [4] - 斯坦福大学报告指出 中国AI模型在能力和使用人数方面似乎已赶上甚至超越了全球同类产品 [6] - 中国在开发开源模型方面的成功部分原因在于政府的支持 [6] 中国主要开源AI模型参与者 - 主要的中国开源AI模型包括深度求索、阿里巴巴旗下的千问和月之暗面公司旗下的Kimi [2] - 字节跳动公司也在研发类似技术 [2]
美国《连线》杂志:2026年将是阿里千问之年
观察者网· 2025-12-31 17:40
文章核心观点 - 全球AI产业重心正在发生位移,中国AI产业正以“技术基座”与“优质资产”的双重身份走向世界舞台中央 [1][5] - 美国《连线》杂志预测2026年将是“阿里千问之年”,标志着中国大模型在全球AI基础设施中的核心地位获得顶级科技媒体认可 [1][3][14] - 中国AI企业已超越“平替”角色,凭借技术开放、成本优势和部署灵活性,反向支撑起硅谷及全球科技企业的核心应用,并在资本市场获得国际顶级机构的资产价值认证 [6][7][8][13][14] 硅谷的实用主义转向 - 硅谷正在发生静默的权力交接,2025年硅谷用脚投票将中国大模型推向全球AI基础设施的核心位置 [6] - Airbnb CEO Brian Chesky表示公司客服AI在很大程度上依赖阿里千问,因其比OpenAI产品表现更好且成本更低 [6] - 硅谷知名投资人Chamath Palihapitiya团队已在Groq平台上转向使用中国模型Kimi-K2,认为OpenAI和Anthropic模型过于昂贵 [6] - 从应用层(Airbnb)到算力层(Groq),中国模型成为降本增效的必选项 [7] 中国模型的技术与生态优势 - 阿里千问、DeepSeek、智谱、MiniMax等中国模型性能稳居第一梯队,原因在于性能优异且易于开发者灵活调整和使用 [3] - 在OpenRouter平台上,以DeepSeek、Qwen、智谱GLM、MiniMax为代表的中国大模型在开源大模型调用上牢牢占据排行榜第一梯队,头部模型性能与美国闭源模型并驾齐驱 [12] - 中国开源生态在技术上保持开放和持续进步,Qwen团队一篇关于增强模型智能训练方法的论文被评为今年NeurIPS最佳论文之一 [7] - 全球最大AI开源社区Hugging Face数据显示,中国开源模型的下载量在2025年7月已正式超越美国,其中千问稳居榜首 [9] 行业标准与全球应用渗透 - 行业对大模型的衡量标准已从迷信参数规模与对话智能,转向对应用广度与部署灵活性的实质考核 [9] - 《连线》指出,衡量AI模型价值的关键标准应看其被用于构建其他应用的广度,以此尺度千问等中国开源大模型正处于上升势头 [7] - 全球科技企业不约而同将中国大模型技术纳入自身核心技术栈,应用从比亚迪的车载仪表盘、Rokid的智能眼镜到硅谷的Airbnb、英伟达乃至Perplexity [12] - 开源领域昔日霸主Meta也在“偷师”千问探索新一代模型开发 [12] 国际资本的资产价值认证 - MiniMax在IPO进程中引入14家基石投资者,认购总额约3.5亿美元,显示出全球资本对一家能在C端产品上与美国巨头掰手腕的中国公司的长期看好 [13] - MiniMax凭OpenAI约1%的资金实现了全模态能力的全球第一梯队,其视频生成产品海螺AI的每付费用户平均收入在9个月内从36美元跳涨至56美元 [13] - 智谱AI引入11家投资机构,基石认购占比接近7成,尽管2025年上半年主要营收仍来自本地化部署,但在下半年其在OpenRouter等全球平台上的API调用量激增 [14] - 国际资本的高比例锁仓意味着市场已跳出对短期财务数据的纠结,认可其作为独立基座模型的稀缺性与战略价值 [14]
阿里辟谣
证券时报· 2025-12-19 21:28
事件澄清 - 阿里千问官方公众号于12月19日发文澄清,此前网络流传的“千问全员会,吃豆包”图片系AI生成,内容不实 [1] - 该虚假图片中描述的“广场大会”为假,且画面中的公司Logo与工牌信息均存在错误 [1] 公司及产品背景 - 阿里千问是由阿里巴巴集团推出的开源大语言模型系列,自2023年8月起已陆续开源四代模型 [6] - 豆包是字节跳动公司推出的AI工具,同样上线于2023年8月,与阿里千问分属不同公司 [6]
外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型
环球网· 2025-12-11 10:39
Meta AI模型训练策略转变 - 美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴的Qwen模型进行蒸馏优化 [1] - Meta的团队在训练过程中使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-OSS以及阿里巴巴的通义千问(Qwen)[3] - 此举标志着扎克伯格态度的空前转变,其此前曾对中国模型可能受到审查影响表示担忧 [3] 阿里巴巴Qwen模型的行业地位 - 阿里Qwen模型被Meta等硅谷巨头用作追赶行业领先水平时的重要参考坐标 [3] - 市场分析认为,阿里Qwen已成为开发者和企业市场的首选模型之一 [3] - 英伟达首席执行官黄仁勋表示,中国在开源领域遥遥领先 [3] 阿里巴巴C端应用增长 - 自11月17日开启公测以来,千问App在短短23天内,全端月活跃用户数已突破3000万 [4] - 千问App成为目前全球增长最快的AI应用 [4]