Qwen(通义千问)
搜索文档
林俊旸曾经历通义内部赛马,这种赛马还会继续
第一财经· 2026-03-06 11:24
核心人事变动与内部赛马机制 - 阿里巴巴通义千问(Qwen)团队技术负责人林俊旸于3月4日宣布离职,后训练负责人郁博文同日离职,Qwen Code负责人惠彬已于1月加入Meta [5] - 林俊旸辞职前曾在通义实验室内部与2025年2月加入、后于9月转岗至通义的许主洪进行“赛马”,但许主洪的产出不理想,而林俊旸团队在2026年春节期间交付了Qwen3.5系列模型 [6][7] - 2026年年初,阿里巴巴引入了Google DeepMind前高级资深研究科学家周浩,其与许主洪转岗逻辑一致,旨在通过增设平级负责人强化内部竞争,周浩入职后直接向通义实验室负责人周靖人汇报 [7][19] - 公司CEO吴泳铭在内部邮件中确认林俊旸离职,并表示将继续加大吸纳优秀人才的力度 [5][8] - 随着更多外部人才引入,类似林俊旸和许主洪之间的内部赛马预计将持续 [20] Qwen模型的成就与市场挑战 - Qwen系列模型是全球累积下载量和衍生模型数量最多的开源模型,自2023年4月首次开源以来,全球累积下载次数已突破10亿次,衍生模型数量突破20万个 [10][11] - 相比之下,DeepSeek的全球累积下载量约为5000多万次,衍生模型数量约2000多个 [11] - 但在以模型调用量统计的维度上,Qwen并未进入全球前列,根据OpenRouter平台2026年2月16日至22日的周榜单,调用量前五的模型中有四家来自中国(MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5、DeepSeek V3.2),Qwen相关模型不在其中 [10][13] - 在风靡全球的AI智能体OpenClaw的模型调用量排名中,月之暗面的Kimi K2.5保持榜首,并因此在该模型发布后不到一个月内累计收入超过其2025年全年收入总和,而Qwen最新发布的Qwen3.5也未进入OpenClaw带火的前十大模型之列 [14] 原生多模态竞争格局 - 原生多模态概念由Google在2023年提出,其Gemini模型为原生多模态架构,区别于GPT-4的“拼装多模态” [16] - 2025年11月,Google的Gemini3在多项基准测试上超越GPT-5,迫使OpenAI启动“红色警报”应对 [16] - 2026年春节期间,月之暗面、字节跳动和阿里巴巴先后发布原生多模态模型K2.5、Seed2.0和Qwen3.5,但截至目前只有K2.5被OpenClaw带火,Qwen3.5和字节跳动的Seed2.0几乎未从中受益 [17] - 字节跳动同期发布的视频生成模型Seedance2.0在影视创作领域引起巨大反响,而Qwen3.5未获得明确的市场标签 [18] 组织架构与战略调整 - 公司可能正在调整模型团队架构,传闻方向是将通义实验室旗下的三个模型团队(通义千问、通义万相、通义百聆)分拆,改为按照预训练、后训练、文本、多模态等职能划分部门,此举若推行,原三位模型技术负责人的职位将不再存在 [24] - 在产品和模型策略上,公司动作与Google相反:Google在2024-2025年将Gemini应用团队及Google Labs并入Google DeepMind,实现从模型到应用的垂直整合;而阿里巴巴则在2024年12月将通义应用团队从阿里云拆分,并入夸克所在的智能信息事业群,后于2025年12月与智能互联事业群合并为千问C端事业群 [21] - 林俊旸生前相信模型层的垂直整合,希望Qwen团队能自主承接更多基础设施工作,但为Qwen做基础设施工程的团队隶属于阿里云,与模型训练团队存在沟通挑战 [22] - 公司目前缺乏一位能像Google DeepMind CEO哈萨比斯那样统领技术与业务的资深领导者,通义实验室由技术领袖周靖人主管,而阿里云CEO职位由集团CEO吴泳铭兼任,千问应用团队也尚未出现能紧密衔接模型迭代与产品放大的关键角色 [25] 开源战略与云业务表现 - 公司自2023年8月起在模型层实行开源战略,覆盖Qwen、通义万相、通义百聆等系列模型,公司CEO吴泳铭在3月5日的内部信中重申将继续坚持开源模型策略 [27][28] - 公司对大模型的终极判断是模型本身不足以构成技术护城河,最终将变为基础设施,其商业价值更可能通过云服务变现,核心是卖算力,而开源有助于建立该商业模式所需的全球影响力 [27] - 然而,开源模型生态并未转化为阿里云在大模型云服务市场的主导权,根据IDC数据,2024年中国公有云大模型对外调用量达114.2万亿tokens,火山引擎以46.4%份额位居第一,阿里云与百度智能云并列第二(19.3%);2025年上半年,阿里云份额提升至27%,但火山引擎仍以49.2%的市场份额保持第一 [29]
晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整
晚点LatePost· 2026-03-04 10:15
核心观点 - 阿里通义千问(Qwen)团队核心负责人林俊旸突然离职,其离职与团队正经历的组织架构调整直接相关,该调整将原本垂直整合的团队拆分为按流程和模态划分的水平分工团队,缩小了其管理范围,且与其技术理念相悖[4][5] - 该事件反映了在AI成为科技公司“全局战争”的背景下,大型科技公司内部核心模型研发团队面临的组织变化、战略与研发目标的对齐问题,以及商业效率与技术影响力之间的张力[5][6][7][8][12] 关键人事变动 - **林俊旸离职**:阿里Qwen团队技术负责人林俊旸于3月3日正式提出辞职,其社交媒体告别状态获得超过5000点赞和700多条评论[2][4] - **其他关键成员离职**:Qwen后训练负责人郁博文同日离职;Qwen Code负责人惠彬原已于2026年1月离职加入Meta[4] - **接任安排**:郁博文的工作将由前DeepMind高级资深研究员周浩接任,周浩向阿里云CTO、通义实验室负责人周靖人汇报[4] - **背景信息**:林俊旸、郁博文、惠彬原均为阿里培养的应届生,参与了Qwen早期训练;林俊旸于2025年以32岁成为阿里最年轻P10;周浩是Gemini 3.0等多个项目的关键贡献者[9] 组织架构调整与团队现状 - **调整内容**:通义实验室计划将Qwen团队从“垂直整合”体系拆分为预训练、后训练、文本、多模态等分开的水平分工团队[4] - **调整动因**:调整旨在改变Qwen团队逐渐变得像“全栈AI实验室”的状况,因其能力扩展与通义实验室其他平行团队(如许主洪团队、通义万相、百聆)产生重合[6] - **与负责人理念冲突**:该调整不符合林俊旸的技术趋势判断,他认为预训练、后训练及Infra团队应更紧密结合;Qwen团队从去年中已开始组建自己的Infra团队[5] - **行业对比**:中国其他大公司AI团队布局各有不同,字节存在“赛马”机制并按流程划分团队,腾讯在调整后变得更加整合[5] Qwen团队的成就与内部张力 - **外部声望与影响**:Qwen在全球开源社区拥有大量开发者,其丰富的模型尺寸受中小创业公司喜爱,并被Cursor等知名公司用作基模进行微调;其多模态开源系列是中国众多具身智能公司的选择[6] - **内部评价与压力**: - **商业化效率追问**:开源模式影响了阿里通过售卖模型API直接获得收入的能力[6] - **具体产出评价**:阿里内部有高管对除夕夜发布的Qwen-3.5并不完全满意,称其为“半成品”[6] - **战略目标压力**:阿里的核心目标是AI云和超级AI App,技术影响力是手段;在AI云上面临走闭源路线的火山引擎激进追赶;千问App在春节补贴大战中未明显缩小与豆包的差距[7] 事件影响与行业观察 - **个人发展**:凭借Qwen的声望,林俊旸此前已收到多位投资人和大公司的工作邀约或创业期待[5] - **管理风格**:林俊旸的管理风格是支持团队成员,激发自驱力和凝聚力,认为团队负责人应招募比自己更优秀的人[10] - **行业普遍现象**:当AI成为大型科技公司输不起的“全局战争”,核心模型研发团队普遍面临更多组织变化,阿里的此次变化发生在外部评价和内部士气相对不错之时,较为特殊[12] - **公司态度**:对阿里而言,任何个体需求都要让位于组织需求[12]
研报 | 预估2026年全球八大CSP合计资本支出将破7,100亿美元,谷歌TPU引领ASIC布局
TrendForce集邦· 2026-02-25 17:01
全球AI服务器产业投资趋势 - 为加速AI应用导入与升级,全球云端服务供应商持续加强投资AI服务器及相关基础建设 [2] - 预计2026年八大主要云端服务供应商的合计资本支出将超越7,100亿美元,年增率约61% [2][5] - 业者除持续采购英伟达、超威GPU方案外,也扩大导入ASIC基础设施,以确保AI应用服务的适用性及数据中心建置成本效益 [2][5] 主要云端服务供应商资本支出与策略 - 八大主要云端服务供应商包含美系的谷歌、亚马逊云科技、Meta、微软、甲骨文以及中系的腾讯、阿里巴巴、百度 [6] - 预计2026年谷歌母公司Alphabet的资本支出有望超1,783亿美元,年增高达95% [6] - 预计2026年Meta的资本支出将破1,245亿美元,年增77% [7] 各公司AI服务器技术路径与采购动态 - 谷歌较其他云端服务供应商更早投入自研ASIC,已累积显著的研发优势,预期今年TPU主力将转进至v8新平台 [6] - 受惠谷歌云平台、Gemini等AI应用带动TPU需求,预估2026年TPU于谷歌AI服务器的出货占比将上升至逼近78%,谷歌也是各云端服务供应商中唯一ASIC机种出货比例高于GPU机种的业者 [5][6] - 亚马逊近期上调对英伟达GB300、V200整柜系统的采购规模,反映其加速导入更高功耗与密度的GPU平台,以应对云端AI训练、推理服务扩张需求,预估2026年其GPU机种于自家AI服务器占比将达近60% [7] - Meta的AI服务器也以英伟达、超威方案为主,预估GPU机种占比仍将达80%以上;另欲推进自研ASIC以降低成本、分散依赖,但其MTIA目前仍受软硬件系统调校耗时等影响 [7] - 微软主要购置英伟达整柜解决方案支持其AI服务器出货,并发布自研芯片Maia 200,锁定高效率AI推理应用 [8] - 甲骨文因应Stargate、OpenAI等扩增AI数据中心项目,持续布局GPU整柜式方案 [8] 中系云端服务供应商动态 - 尽管字节跳动未公开揭露2026年资本支出细节,预估其一半以上资金将用于采购AI芯片相关,英伟达H200可望成为其AI服务器的一项主要方案,但仍需根据后续美国、中国审查情况而定,同时扩大导入本土AI芯片,主要采用寒武纪等方案 [8] - 腾讯外购英伟达等GPU方案支撑云端、生成式AI需求,也同时与当地业者合作发展ASIC自主方案,以分散算力来源并提升系统整合弹性 [9] - 阿里巴巴和百度皆积极自研ASIC AI芯片,阿里巴巴旗下有平头哥、阿里云事业等,百度规划于2026年后陆续导入昆仑新方案,并尝试发展AI服务器超节点天池系列,连接可达数百颗AI芯片以强化整体AI系统运算能力 [9]
2028 年全球情报危机 --- THE 2028 GLOBAL INTELLIGENCE CRISIS
2026-02-24 22:17
全球情报危机情景推演 (2028年) 关键要点总结 一、 核心背景与情景设定 * 这是一份由 CitriniResearch 于 2028 年 6 月发布的宏观备忘录,推演了始于 2025 年底的“全球情报危机”情景,强调其为情景推演而非预测 [3][4][5] * 核心矛盾:人工智能(AI)的持续成功(乐观预期实现)反而导致了宏观经济灾难,即“充裕智能的后果” [3][8] 二、 宏观经济与市场表现 * 截至 2028 年 6 月,失业率达 10.2%,标普 500 指数自 2026 年 10 月高点累计下跌 38% [8] * 危机发展迅速,仅用两年时间,经济从“可控”状态演变为面目全非 [9] * 初期(2026年):AI驱动的裁员推高企业利润,利润被再投资于AI算力,股市飙升(标普 500 逼近 8000 点,纳斯达克突破 30000 点)[10] * 宏观数据矛盾:名义GDP保持中高位单数增长,生产率(单位工时实际产出)增速达1950年代以来最高,但实际工资增长崩塌,消费经济(占当时GDP 70%)萎缩 [11][12][13] * 出现“幽灵GDP”概念:计入国民账户但未在实体经济中流通的产出 [13] * 货币流通速度停滞,负反馈循环(人类智能替代螺旋)形成且无自然制动机制 [14][76] * 2027年第二季度起,经济已陷入衰退(连续两季度实际GDP负增长)[101] 三、 行业冲击与传导机制 1. 软件与SaaS行业(起始点) * **导火索**:2025年底,具备自主能力的编程工具(如 Claude Code、Codex)能力跃升,使开发者可在数周内复现中端SaaS产品核心功能 [19] * **冲击表现**:企业采购时拥有“自建”选项,SaaS产品定价权与差异化瓦解,陷入价格战 [22][25][26] * **典型案例**: * ServiceNow (2026年Q3):新签年度合同价值增速从23%放缓至14%,宣布裁员15%,股价单日跌18% [24][25] * 其收入与客户裁员直接挂钩(按席位销售),形成反身性:客户用AI裁员提升利润率,却直接削减了ServiceNow的收入 [27] * **行业悖论**:受AI威胁最严重的公司成为AI最激进的采用者,通过裁员将节省的成本投入AI以维持产出,个体理性导致集体灾难 [28][30][31] 2. 中介与平台经济 * **核心逻辑**:AI代理消除了基于人类局限(时间、耐心、信息不对称、习惯)的“摩擦”,摧毁了“习惯性中介”的护城河 [36][43][45] * **受影响领域**: * **旅游预订**:2026年Q4,AI代理已能更快更便宜地规划完整行程 [39] * **保险续保**:AI代理每年重新比价,瓦解了保险公司15-20%的被动续保保费收入 [40] * **金融服务**:财务咨询、税务申报、常规法律工作等以“处理繁琐事务”为价值主张的服务被颠覆 [41] * **房地产**:买方中介佣金中位数从2.5-3%压缩至不足1%,越来越多交易无人类买方中介参与 [42] * **外卖平台**:编码智能体降低开发门槛,市场碎片化,利润率压缩至近零。DoorDash等依赖“主屏幕习惯”的商业模式失效 [46][47][49][50][51] * **支付系统**:AI代理为寻求更低成本,转向使用稳定币(通过 Solana 或以太坊 L2s)进行机器对机器交易,冲击传统银行卡支付(2-3%交换费率)[54][55] * 万事达卡 2027年Q1:消费交易额同比增速从5.9%放缓至3.4%,提及“代理主导的价格优化”压力 [56] * 美国运通等发卡机构受白领客户减少和交换费收入下降的双重打击 [59] 3. 劳动力市场结构性变化 * **冲击范围**:美国经济本质是白领服务经济,白领占就业50%,贡献约75%的可支配消费支出,AI冲击的是经济核心 [61] * **数据表现**: * 2026年10月 JOLTS:职位空缺数跌破550万,同比降15%;失业人数/职位空缺比升至1.7(2020年8月以来最高)[69] * 2026年底-2027年初:软件、金融、咨询等行业招聘大幅下降,白领岗位空缺萎缩,蓝领相对稳定 [70] * **工资与就业下行螺旋**: * 被替代的白领“降级就业”,涌入服务业和零工经济,压低了该领域原有工资 [85][86][87] * 仍在岗的白领因恐惧裁员而减少消费,增加储蓄 [91] * 2027年Q3:初请失业金人数飙升至48.7万(2020年4月以来最高),多数为白领专业人士 [93] * **与传统衰退的区别**:本次失业集中于高收入人群(收入分布上层),其消费占比较高(前10%占50%以上,前20%占约65%),导致消费冲击远大于失业人数比例,且因有储蓄缓冲,影响具有滞后性但更深远 [96][97][99][100] 4. 全球影响 * **受益者**:经济结构完全顺应AI趋势的地区(如中国台湾、韩国)表现强劲;AI基础设施公司(如英伟达、台积电)及超大规模云服务商(季度数据中心资本支出1500-200亿美元)仍繁荣 [79][80] * **受害者**:印度IT服务业(年出口额超2000亿美元)因AI编程代理边际成本骤降(近乎电费)而受重创,合同取消加速,卢比4个月内对美元贬值18%,至2028年Q1 IMF已介入讨论 [81][82] 四、 金融体系风险升级 1. 私募信贷与违约潮 * **背景**:私募信贷规模从2015年不足1万亿美元膨胀至2026年超2.5万亿美元,大量资金投向假设永续中期双位数增长的SaaS公司杠杆收购 [102] * **风险暴露**:2027年,私募股权支持的软件、信息服务、咨询公司开始违约 [106] * **标志性事件**:Zendesk(2022年以102亿美元私有化)的50亿美元直接贷款(史上最大ARR支持贷款)因AI代理颠覆其客户服务业务导致ARR不再“经常性”,于2027年9月违约,贷款市值减记至面值的58美分 [107][108][109][110] * **评级行动**:2027年4月,穆迪下调14家私募股权支持软件公司总计180亿美元债务评级 [105] 2. “永久资本”的脆弱性与保险业传导 * **结构**:大型资管公司(如 Apollo, Brookfield, KKR)收购寿险公司,利用年金保费作为长期负债投资于自身发起的私募信贷,赚取利差和管理费 [115] * **风险**:“永久资本”实为美国家庭储蓄(年金),当底层私募信贷违约,亏损冲击了持有非流动性资产却背负长期偿付义务的资产负债表 [117] * **监管收紧**:2027年底,监管机构开始收紧寿险公司持有私募信贷的风险资本要求,迫使保险公司增资或出售资产,加剧市场压力 [119][121] * **复杂性**:通过离岸再保险和SPV的监管套利架构,导致风险归属不透明,加剧系统性担忧 [122][124] 3. 住房抵押贷款市场风险 * **市场规模**:美国住宅抵押贷款市场约13万亿美元 [130] * **风险本质**:违约非因贷款质量(借款人为FICO 780+的优质客户)或利率冲击,而是因为支撑还款能力的“未来收入预期”发生结构性变化 [131][133][134] * **早期迹象**:2027年,优质家庭通过提取HELOC、401(k)和增加信用卡债务来维持房贷还款,债务收入比翻倍 [136] * **数据表现**:2028年6月,Zillow房价指数显示旧金山同比跌11%,西雅图跌9%,奥斯汀跌8%;房利美警示科技/金融从业者集中区域早期违约率升高 [128][129] * **潜在冲击**:若房贷市场崩溃,股市跌幅或堪比全球金融危机(57%),标普500可能跌至3500点 [145] 五、 政策困境与根本挑战 * **政策滞后**:政府应对不足且混乱,公众对救助能力信心下降 [18][147] * **财政基础侵蚀**:政府收入依赖对人力时间的征税(个人所得税和薪资税)。2028年Q1,联邦财政收入比CBO基线预测低12%,因就业人数和收入水平结构性下降 [151][152] * **劳动份额骤降**:劳动者占GDP份额从2024年的56%骤降至2028年的46%,四年降幅为有记录以来最陡峭,产出收益流向资本和算力而非劳动力 [153] * **政策工具失效**:传统货币宽松(降息、QE)可缓解金融条件,但无法解决实体经济核心问题——AI使人类智力价值下降。即便利率降至零,也无法改变AI代理以极低成本(如每月200美元)替代高薪白领(如年薪18万美元产品经理)的事实 [143][144] * **根本矛盾**:经济循环流转断裂,产出不再经由家庭部门和税收系统回流,而政策工具箱并非为此类结构性危机设计 [154][148]
中国企业跻身奥运赞助商,日企缺席
日经中文网· 2026-02-15 16:06
米兰-科尔蒂纳冬奥会赞助格局 - 2026年米兰-科尔蒂纳冬奥会顶级赞助商中,阿里巴巴集团、TCL等3家中国企业名列其中,顶级赞助商中已不见日本企业身影 [2] - 奥运顶级赞助费用巨大,2021年至2024年期间来自顶级赞助商的总收入达到30亿美元,简单计算每家企业每年的负担额接近80亿日元 [2] - 赞助商可按行业获得独占性的营销权,并被允许使用奥运会标志 [2] 中国企业赞助与技术参与 - 阿里巴巴自2018年平昌冬奥会起成为顶级赞助商,TCL则从本届米兰-科尔蒂纳冬奥会开始加入 [4] - TCL董事长李东生表示,成为奥运赞助商是多年的梦想 [4] - 阿里巴巴在本届冬奥会上提供支撑赛事运营和转播的AI技术,例如全球网站的聊天服务以及面向工作人员的AI助手,均由阿里巴巴开发的AI模型“Qwen(通义千问)”提供支持 [8] - 在冰球、跳台滑雪等17个项目中,采用了可实现360度回放的影像技术,AI可在十几秒内重构摄像画面,实现视角平滑移动或从画面中识别运动员并将跳跃轨迹像连拍照片一样再现,用于转播的云基础设施同样来自阿里巴巴 [8] - TCL在运动员村安装了洗衣机、烘干机等智能家电,并向转播中心提供电视、显示器及技术支持 [8] - TCL于2025年1月宣布与索尼集团成立合资公司,承接电视业务 [8] 往届奥运会技术赞助商变迁 - 2021年东京夏季奥运会上,点缀开幕式的无人机技术来自美国半导体巨头英特尔,其利用高性能芯片的数据处理技术也被用于赛事转播,松下控股则通过投影映射用投影机和音响设备等为开幕式演出提供支持 [5] - 英特尔在2022年出售了无人机业务,松下控股则在2024年宣布出售投影机业务(虽随后因条件未谈拢而撤回) [5] - 英特尔和松下控股均在2024年巴黎夏季奥运会后结束了顶级赞助合同 [5] - 本届冬奥会引入了一种被称为FPV(第一人称视角)的新型无人机,该设备能够从后方追踪拍摄时速接近100公里的运动员,室外项目最多部署15架 [5] 行业竞争态势 - 奥运不仅是品牌和产品展示的平台,也是前沿技术亮相的舞台 [4] - 与日美科技企业形成对比而崛起的,是中国科技企业 [5] - 从曾经由日本企业席卷全球的电视产业,到最新的AI模型,中国科技企业正在名实两方面提升存在感 [8]
这场AI竞赛,归根结底是“我们的中国人”对阵“他们的中国人”……
虎嗅APP· 2026-02-03 17:26
全球AI人才版图 - 根据MarcoPolo数据,2022年中国在全球AI人才产出中占据绝对优势,份额高达**47%**,而美国本土产出占比仅为**18%** [9] - 美国仅有一个全球AI人才产出占比超过**10%** 的超级集群——旧金山湾区(**14.72%**),而中国拥有三个:北京(**16.11%**)、上海-杭州(**14.82%**)和粤港澳大湾区(**11.71%**)[14][17] - 北京海淀区的顶级AI实验室密度和产出已超过旧金山的“脑谷”,该区域聚集了清华大学(贡献**4.73%**)、北京大学(**3.63%**)以及字节跳动、智谱AI、月之暗面、MiniMax等一线公司[18] 中美AI人才结构差异 - 美国AI人才产出高度集中在企业实验室(如Google、Meta、NVIDIA、OpenAI),而中国则是“高校+企业”双轮驱动,清华大学、北京大学等高校在顶级会议上的统治力超过斯坦福、伯克利等美国高校[20] - 全球顶尖AI研究员中,按本科学位统计,**47%** 来自中国高校,**18%** 来自美国高校,但这些中国顶尖人才中约有**42%** 选择在美国工作[27][28] - 中国顶级AI人才的国内留存率已从**2019年的11%** 飙升至**2022年的28%**,并在2025-2026年加速[32] 区域竞争格局 - 深圳和杭州在AI应用层,特别是具身智能(Embodied AI)领域展现出爆发力,深圳的优必选、大疆等公司正将AI模型与机器人结合,中国在机器人与AI结合领域的论文产出极高[22][23] - 欧洲作为整体在全球AI人才产出中仅占**5.35%**,不及中国一个城市群,原因可能包括过度监管(如GDPR)和集群效应缺失[34] - 新加坡以一城之力产出占比达**5.61%**,超越了整个欧洲大陆,在中美脱钩背景下成为连接东西方的资本、算力和人才超级节点[36] 技术发展路径与竞争力 - 当前格局是美国掌握“定义范式”的0到1能力,而中国展现了“快速跟进与工程化”的1到100能力,但中国顶尖AI模型(如DeepSeek、Qwen)与美国最先进技术的差距已从“代差”缩小到“月差”[39][41] - 美国AI产业侧重于软件和SaaS,中国侧重于制造和MaaS,当AI进入需要与物理世界交互的“具身智能”时代,中国庞大的工程师红利和供应链将转化为巨大的落地优势[47] - 在AI研究阶段,人才密度的权重远超算力,智力作为新时代的关键资源,其流向将影响竞争格局[9][54]
马斯克悄悄让Grok 5在韩服打LOL?醉翁之意在世界AI模型
36氪· 2026-02-02 08:22
文章核心观点 - 一个在《英雄联盟》韩服服务器上出现的名为“택배기사한 진”的神秘账号,因其在51小时内完成56场对局并取得52胜4负、胜率一度高达95%的惊人战绩,以及连续长时间高强度对局、全能英雄池和精准操作等非人类特征,被广泛猜测为人工智能(AI)在操控[1][3] - 证据和舆论将这一神秘账号与埃隆·马斯克旗下xAI公司此前宣布的Grok 5项目联系起来,该项目计划在2026年挑战顶级职业战队T1,此次事件被视为Grok 5在复杂游戏环境中进行“类人”多模态能力训练和展示的预演[4][6][11] - 此次事件的核心意义超越了电竞游戏本身,其真正目的在于展示Grok 5在通过视觉(摄像头)理解复杂动态场景方面的强大能力,这被视为推动特斯拉Optimus机器人和FSD(完全自动驾驶)实现“端到端视觉智能”的关键一步[11] AI技术展示与限制 - 该账号的操作展现出典型的AI特征,包括决策冷静、做出不合常理的决策、精通所有位置与英雄,以及对线期以精准走位躲避技能且几乎没有多余动作,体现了AI追求效率最大化的特性[3][4] - 与早期游戏AI(如OpenAI Five和AlphaStar)直接从游戏内存读取数据不同,此次疑似Grok 5的测试被限制在“人类条件”下,仅通过摄像头读取屏幕信息,这极大地增加了任务难度[6] - 在视觉模式下,AI需要从整个屏幕画面中(可能只有10-20%是有效信息区)实时处理繁杂特效,精确定位英雄位置和状态,并进行动态决策和语义分割,同时纠正摄像头畸变带来的误差,这对模型的推理效率和实时决策能力提出了极高要求[7][8] 对电竞与游戏行业的潜在影响 - AI大模型为电竞行业带来了新的机会,例如可用于赛后分析、选手训练,通过模拟特定战队的比赛录像生成其行动逻辑,充当高水平的训练对手,帮助战队提前熟悉对手思路并制定针对性战略[12] - AI在游戏开发与运营中具有广泛应用前景,例如在测试端模拟不同水平的真实玩家进行海量对局,以更精准地平衡新英雄强度;或利用AI生成更智能的NPC,甚至调控玩家游戏体验(如为连败玩家匹配AI队友)[16][17] - AI技术进入游戏领域也引发了对外挂泛滥的担忧,尽管完整版大模型难以在个人电脑运行,但其决策逻辑可能通过知识蒸馏等技术迁移到参数更小的开源模型(如Qwen)上,从而制造出拥有顶级职业选手意识和操作的、难以被反作弊系统识别的“AI玩家”[14][16] AI发展的战略意义 - Grok 5在《英雄联盟》中的挑战行为,本质上是为证明其已拥有接近甚至超越人类的图像识别与复杂场景理解能力,这是实现通用人工智能和理解现实世界的关键一步[11] - 该技术突破若能实现,将直接赋能特斯拉的Optimus机器人和汽车FSD系统,推动其向真正的“端到端视觉智能”迈进,具有重大的商业和战略价值[11] - 此次事件被视为游戏行业的又一个“AlphaGo时刻”,预示着AI将从游戏开发、测试、运营到玩家体验等全环节,给整个行业带来巨大而深远的变革[17]
兰德:《美中人工智能市场竞争:大模型全球使用模式分析》报告
欧米伽未来研究所2025· 2026-01-29 10:04
文章核心观点 - 兰德公司报告揭示,美国AI模型虽占据全球流量主导地位,但市场格局因中国开源模型DeepSeek R1的崛起而发生剧变,显示出美国领导地位的脆弱性及全球AI竞争正沿地缘政治断层线分裂 [2][4][15] - 中国模型通过满足增量市场需求实现份额跃升,其增长并未蚕食美国模型的存量用户,表明全球AI市场远未饱和且存在巨大未满足需求 [4][5] - 驱动用户选择的核心因素并非价格、多语言支持或政府外交,而是模型性能是否跨越“可用性阈值”以及该领域极低的用户转换成本 [8][9][10][12] - 中美科技企业的根本商业模式差异可能影响长期竞争格局,中国倾向于将AI视为可承受亏损的公共基础设施,而美国公司遵循追求高利润的硅谷风险投资模式 [13] - 未来的竞争态势将极度动荡,持续创新是美国维持优势的唯一防御手段,而技术生态的竞争也关乎数据主权和文化影响力 [15][16] 全球AI市场竞争格局演变 - **美国模型的绝对统治与脆弱性**:截至2025年8月,美国大语言模型占据全球约93%的网站访问流量,从2024年4月到2025年5月,全球主要LLM平台月访问量从24亿次增长三倍至82亿次 [4] - **中国模型的突破性增长**:DeepSeek R1发布后两个月内,基于中国的LLM网站访问量激增460%,全球市场份额从约3%迅速攀升至13%,随后稳定在6%左右,实现了质的飞跃 [4][5] - **增量市场与地缘政治色彩**:中国模型的增长主要来自新开辟的增量市场,而非蚕食美国存量用户,且增长与国家人均GDP呈负相关(r=-0.25),在俄罗斯、中东、非洲、南美洲等发展中地区渗透率爆发 [5][6] - **地缘化使用版图**:2025年,中国模型在11个国家的市场份额超过20%,在30个国家超过10%,其使用版图与现实世界的地缘政治版图高度重合 [6] 驱动因素的传统认知与数据真相 - **价格并非消费者决策核心**:尽管中国模型API定价具碾压优势(如DeepSeek R1每百万输入token成本0.55美元 vs ChatGPT 4.1的2.00美元),但约98%的ChatGPT用户使用免费版本,终端用户的“零成本”体验使B端价差失效 [9] - **多语言能力护城河被填平**:中国模型如Qwen支持语言数量从26种暴增至119种,DeepSeek也宣称支持超100种语言,基础可用性上语言已非主要门槛 [10] - **政府外交努力与用户实际选择脱节**:2015至2025年间,中国使馆发布的AI合作公告数量比美国多32%,覆盖目标国家多166%(达1257个次),但政府层面的推广并未有效转化为个人用户的实际流量 [10] 市场格局剧变的根本原因 - **性能阈值是关键转折点**:在DeepSeek R1发布前,美国模型97%的份额源于中国模型太弱,缺乏可行替代品,是垄断而非竞争的结果,一旦中国模型核心性能跨过“可用性阈值”,格局瞬间坍塌 [12] - **近乎零的用户转换成本**:AI大模型领域,用户在不同模型间切换无需新硬件、数据迁移或学习新操作,所有交互通过浏览器聊天框完成,使得先发优势极度脆弱,品牌忠诚度不堪一击 [12][13] - **商业模式的根本差异**:美国公司遵循硅谷风投模式,追求烧钱增长后高额利润回报,中国公司在政府补贴和产业政策支持下,更倾向于将AI作为可承受亏损的公共基础设施进行长期投入 [13] 未来竞争态势与启示 - **创新成为唯一防御手段**:由于缺乏用户锁定护城河,美国维持领导地位的唯一途径是持续不断的创新,一旦创新速度放缓或被追平,地缘政治偏好和成本优势将迅速填补真空 [15] - **全球化市场沿地缘政治线分裂**:全球AI市场正沿地缘政治断层线分裂,在“全球南方”,一个替代性的技术生态正在形成,这涉及数据主权、文化影响力和未来数字基础设施控制权的更深层博弈 [15] - **商业模式面临根本性质问**:如果未来竞争核心在于谁能最快将技术转化为廉价、普及的公共服务,那么硅谷依赖高利润垄断的商业模式,在与将AI视为公共产品的举国体制竞争中,可持续性存疑 [16]
没有商业模式,是DeepSeek最坚固的“护城河”
硬AI· 2026-01-18 21:03
DeepSeek的独特商业模式与行业地位 - 公司是全球AI巨头中唯一坚持零外部融资、无商业化压力的异类,使其能够不计成本、专注于AGI梦想 [2][3][6] - 公司创始人梁文锋坚持不进行外部融资,将公司控制权置于资金之上,这在所有顶尖AI实验室中独树一帜 [6][8] - 公司缺乏传统商业模式,但这被视为其长期优势,使其内部激励机制完全与AGI研究对齐,无需对财报或商业化KPI负责 [18][24][31] 自筹资金的财务基础与运营模式 - 公司的研发资金完全由其创始人梁文锋背后的量化基金“幻方量化”提供,该基金在去年实现了53%的回报率,创造了超过7亿美元(约50亿人民币)的利润 [7][23] - 这种用“老钱”养“新梦”的模式使公司无需迎合外部投资者,能够自主决定将利润用于购买GPU和招聘人才 [7][20][23] - 公司在2023年成立初期曾尝试融资但被国内VC拒绝,这反而成为“塞翁失马”,使其避免了背负商业化压力而导致动作变形 [8][22] 在开源AI领域的竞争态势 - 公司通过发布V3和R1模型打响了MIT License许可开源模型的第一枪,但目前已不再是市场上唯一或最开放的开源玩家 [5][14] - 当前全球开放程度排名前三的模型分别来自NVIDIA、Allen Institute和MBZUAI,公司的模型在能力、成本或开放度上已不再全面领先 [5][15][18] - 公司的竞争推动了行业开源进程,例如促使OpenAI发布了其gpt-oss模型,但公司自身并未开源其训练数据集或主代码库 [14] 零融资模式带来的组织与文化优势 - 公司因无外部融资和估值,避免了“大公司病”,组织架构极度扁平,内部没有因争夺算力资源而产生的官僚主义、内斗和权力斗争 [9][28] - 与一些资金雄厚的实验室(如Thinking Machines Lab)出现的浮夸文化(如定制品牌杠铃片)相比,公司文化更为纯粹,专注于研究 [9][28][30] - 缺乏外部资金附带条件,使得公司能够完全基于“科研品味”来支持新想法,而非盲目堆砌算力 [10][26][27] 对算力与创新关系的行业洞察 - 前OpenAI研究员Ilya Sutskever指出,颠覆性创新往往不需要无限堆算力,例如Transformer架构最初仅使用了8到64张GPU [10][27] - 过多的资金可能导致团队依赖算力而失去科研品味,公司因资源有限反而可能更注重创新效率 [10][11][26] - 公司模式证明,进行前沿研究需要一定算力,但并非绝对需要最大量的算力 [27] 投资视角下的价值与悖论 - 从投资者角度看,公司是极具吸引力的投资标的,但一旦接受外部投资,其纯粹专注于AGI研究的独特特质将可能消失 [12][31] - 即便如埃隆·马斯克的xAI也未能抗拒资本,近期完成了高达200亿美元的融资,凸显了公司坚持零融资的罕见性 [22][23] - 公司通过完全控制权换取了较少的资金,使其命运完全服务于“让AGI成为现实”的长期目标,无需考虑风投所要求的大规模商业化回报 [24][31]
没有商业模式--DeepSeek最坚固的“护城河”
华尔街见闻· 2026-01-18 16:58
文章核心观点 - DeepSeek实验室因其“零外部融资、无商业化压力”的独特模式,在全球AI行业中构建了最坚固的护城河,使其能够专注于AGI研究而不受资本裹挟 [2][8][13] 市场预期与行业竞争格局 - 市场对DeepSeek在农历新年前发布更强大新模型期待高涨,但行业已习惯每隔一两个月就有新的“开放权重”模型发布,DeepSeek的新模型可能难以再次震惊世界 [3] - DeepSeek通过发布V3和R1打响了MIT License许可开源模型的第一枪,但已不再是市场上最开放的实验室,因其未开源训练数据集或主代码库 [4] - 目前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2) [5] - DeepSeek的模型在开放模型中已不再是最强、最便宜或最开放的 [8] 独特的“零融资”商业模式 - DeepSeek是全球顶尖AI实验室中唯一坚持“零外部融资”的异类,其创始人梁文锋将控制权看得比融资更重要 [3][10] - 公司通过其关联的量化基金“幻方量化”的利润来自筹资金,该基金在去年以53%的回报率创造了超过7亿美元(约50亿人民币)的利润,并用于购买GPU和招聘人才 [3][12] - 2023年公司成立初期寻求风险投资失败,因中国VC的短视和风险厌恶,但这反而使其避免了商业化KPI压力,只需对技术负责 [3][10] - 即便在获得全球知名度后,公司仍拒绝筹集外部资金,以保持对自身命运和AGI研究目标的完全控制权 [12][13] 资金充裕带来的组织问题 - 过多的外部资金会滋生“大公司病”,例如资源内耗、部门宫斗以及浮夸的排场,如某些实验室在健身房使用印有自家Logo的定制杠铃片 [3][16] - 外部融资会带来估值、股票期权以及商业化的期望,这可能导致组织层级化、嫉妒和人才被挖角 [16][17] - 相比之下,DeepSeek因无外部资金,组织架构极度扁平,内部没有资源竞争和官僚主义,有利于研究想法的支持与实施 [15] 算力与创新效率的关系 - 前OpenAI研究员Ilya Sutskever指出,颠覆性创新并不总是需要无限堆算力,例如Transformer架构最初仅使用了8到64张GPU [3][14] - 对于研究而言,需要一定量的算力,但并非绝对需要最大量的算力,过多的资金和算力反而可能让团队变懒,失去“科研品味” [3][14][15] - DeepSeek通过消除“因有钱就必须购买更多算力”的必要性,避免了资源分配的内部斗争,使良好的研究品味能得到最大支持 [15] 行业融资趋势对比 - 全球AI行业资金涌入剧烈,几乎所有有影响力的实验室都在筹集更多资金,例如埃隆·马斯克的xAI近期完成了高达200亿美元的E轮融资 [3][11] - 一批由明星研究员领导、风投支持的“AI新实验室”涌现,如Thinking Machines Lab、SSI(已筹集30亿美元)和AMI Labs [11][17] - 在此背景下,DeepSeek坚持自筹资金,使其激励机制与行业内其他实验室截然不同,实现了内部目标与AGI研究的最大化对齐 [18]