Llama
搜索文档
谷歌版两门「小钢炮」开源,2.7亿参数干翻SOTA
36氪· 2025-12-19 14:17
谷歌发布Gemma 3家族新模型 - 公司在“大模型”领域发布Gemini 3 Pro和Flash后,继续在端侧“小模型”发力,于近期发布了两项与端侧相关的新技术 [1] - 新发布的两个模型均属于Gemma 3家族,分别是T5Gemma 2和FunctionGemma,两者均为“小模型”但专攻方向不同 [3] T5Gemma 2:架构创新与性能 - T5Gemma 2是一个底层架构创新,是首个开源的多模态长上下文编码器-解码器模型,其最小规模为270M–270M参数 [1] - 公司开源了T5Gemma 2的三种预训练模型规模:270M–270M、1B–1B以及4B–4B [5] - 该模型采用编码器-解码器架构,与当前主流的仅解码器架构不同,代表了AI技术领域的“另一条路” [4][14] - 在多个基准测试中,T5Gemma 2展现出强大的多模态性能,超越了公司自己的Gemma 3模型 [8] - 在代码、推理和多语言等任务的通用能力上,T5Gemma 2整体上优于对应规模的Gemma 3模型 [9] - 相较于Gemma 3和第一代T5Gemma,T5Gemma 2在生成长上下文内容的质量上有显著提升 [9] - 在预训练阶段的性能可能超过对应体量的Gemma 3模型,而在后训练阶段则取得了显著更优的表现 [11] 编码器-解码器架构的回归与优势 - 在GPT、Llama、Gemini、DeepSeek等仅解码器架构主导的时代,T5Gemma 2是对经典Transformer中编码器-解码器路线的回归与现代化改造 [14][15][16][17][18][19][20] - 编码器-解码器架构采用“先读懂再动笔”的机制,能强迫模型先消化输入再生成输出,这种机制天生更严谨,有助于减少“幻觉”问题 [32] - 该架构在多模态处理方面具有天然优势,编码器可以作为处理图像信号的“眼睛”,比强行塞给仅解码器模型处理更顺畅 [33][34] - 在手机等端侧算力有限的环境中,编码器-解码器架构往往能用更少的参数达到与大型仅解码器模型相当的效果,效率更高 [35] - 公司并未从零训练T5Gemma 2,而是采用“模型适配”技术,利用已训练的Gemma 2或Gemma 3解码器模型作为种子,将其权重映射到新结构中,大幅降低了计算成本 [36] FunctionGemma:功能与场景创新 - FunctionGemma是一个专为函数调用优化的模型,参数规模为2.7亿,可在手机、浏览器及其他设备上运行 [1] - 该模型是对模型“技能”的专项训练,类似于剥离大模型的知识类能力,只保留针对性的函数调用功能 [7] - FunctionGemma旨在解决大模型落地痛点,让模型“不仅要能聊,还要能干活”,能够输出结构化数据去调用外部API或工具 [37][40] - 该模型为AI智能体设计,擅长多步骤推理和执行任务,且极致轻量化,可直接运行在手机等低功耗边缘设备上,作为系统的“控制中枢” [40] - 它是一个专门设计的“神经路由器”,旨在解决云端大模型在延迟、隐私和成本上的固有缺陷 [42] - 模型专注于函数调用这一特定任务的极致优化,通过小型化和专业化,将智能下沉至网络边缘 [44] - 其270M参数规模在当今时代显得微不足道,但证明了在特定领域,小模型通过高质量数据微调可达到甚至超越大模型的表现 [44] - 模型剔除了大量通用世界知识,专注于解析JSON、匹配函数签名和处理参数类型等技能 [45] 端侧部署与移动端战略 - FunctionGemma专为在移动设备上运行而设计,其270M参数在FP16精度下的权重大小约为540MB,仅占现代Android旗舰机总内存的5%-7%,可在后台常驻 [46][48] - 通过Int8量化,模型大小可降至约270MB;通过Int4量化,可降至约135MB,使其能在入门级甚至嵌入式设备上流畅运行 [49][50][51] - 公司发布该“小”模型背后,隐藏着对未来AI计算架构的深刻思考及在移动操作系统控制权争夺中的防御性布局 [52] - 在移动互联网向意图驱动发展的下一阶段,FunctionGemma试图让AI成为通用的用户界面,用户可直接表达意图而非点击图标打开应用 [53][54][55] - 通过让模型直接学习应用的API定义,开发者只需暴露工具,FunctionGemma就能理解并操作这些工具 [56] - 公司通过开源FunctionGemma,意在制定一套AI与应用交互的标准协议,如果所有Android开发者都按其格式定义工具,Android系统将成为强大的智能体平台,加深公司护城河 [57][58] 应用验证与行业影响 - 公司提供了两个参考实现来验证FunctionGemma的能力,展示了其在游戏和系统控制领域的潜力 [59] - 在系统控制场景中,经微调的FunctionGemma在将自然语言指令转换为Android系统意图的任务上,准确率达到85%,远超未微调基座模型的58% [60][61] - 在名为“Tiny Garden”的游戏Demo中,FunctionGemma展示了任务分解能力,可将一句语音指令拆解为一系列函数调用,且整个过程完全离线,无需联网 [62] - 对于开发者,FunctionGemma提供了低成本、高隐私的方案,将智能体能力集成到普通应用中,无需昂贵服务器开销 [64] - 对于手机厂商,270M的参数量是完美的“甜点”,既能利用现有NPU硬件,又不会过度挤占系统资源,为打造“AI原生操作系统”提供了理想基础 [64] - 对于公司自身,这是在AI时代捍卫Android生态控制权的关键一步 [64]
Meta再爆大瓜,气走杨立昆的Wang也受不了小扎了?
36氪· 2025-12-18 16:12
公司AI战略与重组 - 公司今年夏天开始投入重金打造“超级智能实验室”,并对内部AI团队进行多次重组,旨在加速AI发展 [1] - 经过半年四次重组,公司AI业务以“超级智能实验室”为核心,分为FAIR、MSL Infra基础设施、产品与应用、以及直接负责大语言模型的TBD Lab四个部门 [11] - TBD Lab是重组后的重中之重,由首席AI官Alexandr Wang直接领导,直接向首席执行官汇报,其现阶段核心目标是在明年一季度发布一个内部代号为“牛油果”的全新闭源AI模型 [1][2][11] 关键人物动态与管理挑战 - 公司以143亿美元收购数据标注公司Scale AI的49%股份,并聘请其28岁的创始人Alexandr Wang出任“首席AI官”,领导TBD Lab [2] - 包括Wang在内的多位关键高管对首席执行官的管理方式感到不满,Wang曾抱怨其微观管理令人窒息,而前GitHub负责人Nat Friedman也面临要求过快交付产品的巨大压力 [2][4] - 图灵奖得主、首席AI科学家杨立昆因需向Wang汇报以及路线分歧(反对闭源并质疑大语言模型路径),已于本月初官宣将于年底离职 [5][7] 人才与文化冲突 - 公司高薪从外部引进人才,但引发了与老员工的摩擦,有内部员工质疑Wang缺乏大公司管理经验且技术背景非顶级研究员,显得“德不配位” [7] - 高薪引进的人才留存也面临挑战,例如首席AI科学家赵晟佳曾考虑返回OpenAI,另有两位研究员在加入一个月内就离职返回OpenAI [7] - 公司正在抛弃早期强调“忠诚”的文化,激进引入外部管理者,导致“扎克伯格的朋友”等老派高层频频离职,如首席法律官和首席营收官近期相继离开 [8] 项目进展与财务压力 - 公司目前尚未拿出显著的AI成果,但正全力推进“牛油果”项目,计划使其在推出时达到Gemini 2.5的性能水平,并在夏季达到Gemini 3的水平 [1][11] - 公司2025年资本支出预计至少达700亿美元,远高于前一年的390亿美元,并已通过发行公司债券等方式筹资以支付数据中心和芯片成本 [12] - 公司宣布明年AI支出可能超过1000亿美元,但由于缺乏清晰的货币化路径,该消息导致股价下跌超过10%,市值蒸发超过2080亿美元 [12]
深度| 大模型年终观察,如何定义2025年的"好模型"?
Z Potentials· 2025-12-17 20:00
文章核心观点 - 2025年AI行业正经历从追求“跑分”到建立“信任”的深刻范式转变,行业共识是开源模型正从“可选项”成为“默认使用的必选项”[1] - 衡量模型的标准正从“选秀式逐冠军”转向“基建式找伙伴”,模型的基础能力是入场券,而由评测、部署、交付三个维度构成的“信任”是AI融入业务流程的通行证[2][3] - 行业已出现从“技术玩具”到“生产工具”的拐点,驱动力量从“新奇”变为“信任”,未来竞争核心将是业务可靠性、卓越运营、可控性、安全性与可观测性[12][31] 行业趋势:从尝鲜到留存,生产力拐点已现 - 开源模型调用量在关键发布后,首次实现了“峰值后高位平稳”,而非断崖式下跌,标志着真实使用和留存的开始[5][15] - 开源权重模型的token份额在2025年底稳定突破了平台总量的三分之一[5] - 用于复杂推理、规划和代理任务的“推理类模型”调用量爆炸式增长,其token消耗份额从2024年底几乎可忽略不计飙升至超过50%[8] - API调用的平均任务长度显著上升,从2023年后期不足2000 tokens增长到2025年后期超过5400 tokens,表明真实世界的复杂任务正稳定交给AI完成[8][9][12] 评测体系:从分数游戏到多维共识 - 模型发布初期,赢得关键榜单头筹仍是获取关注的“入场券”[13] - Kimi K2 Thinking是2025年典型代表,在Artificial Analysis的Intelligence Index上获得开源模型最高分,并在LMSYS Chatbot Arena开源模型中排名第一,从而获得全球关注[14][18] - 行业正形成多维评测体系,主要包括两类: - **数据驱动型**:以Artificial Analysis为代表,采用“智能指数+成本指数”双轴框架评估“性价比”,涵盖智能度、成本、可控性、生态适配度[20] - **使用实证型**:以OpenRouter为代表,基于其积累的100T tokens真实调用数据,评测模型在生产中的成功率、序列长度、调用失败率等,峰值后的高位调用量是产品力最直接证明[22] - 资深从业者的实际选择成为新维度,如前OpenAI CTO创办的公司在其产品中集成Kimi K2 Thinking以支持复杂推理[18] 部署能力:产业化与成本透明化 - 可部署性是建立信任的第二地基,企业关注“跑得起、跑得稳、跑得久”[24] - 硬件支持取得突破,NVIDIA数据显示Kimi K2 Thinking、Qwen2等MoE模型在GB200 NVL72架构上实现了10倍推理加速,同时每token成本降低90%,证明其大规模产业化部署潜力[24] - 云端推理平台推动部署成本透明化,如Fireworks、Together、OpenRouter公开每百万tokens的精确报价,使模型调用像云计算资源一样“明码标价”[24] 交付保障:治理、观测与复现 - 交付是确保模型在企业环境中“跑得稳”的最后一公里,关乎可治理、可观测、可复现[25] - **可治理**:2025年Q4,AWS、Azure、Google Cloud三大云厂商几乎同时将Claude、Kimi、Mistral等顶级模型纳入其企业级托管服务,使模型可通过统一API调用并享受平台的安全、权限管理和SLA保证,正式进入企业IT治理框架[26] - **可观测**:行业在工具调用可观测性上取得进展,OpenRouter推出的exacto系统能量化和监控模型在工具调用任务上的表现方差,通过遥测数据确保稳定性和一致性[27] - **可复现**:行业迈出关键一步,例如Hugging Face展示的Kimi K2 Thinking应用示例清晰记录了模型执行多步工具链的全过程trace,使模型能力进入“流程可复现、任务可交付”阶段[30] 未来展望:业务可靠性与卓越运营 - 2026年的关键词是“卓越运营”,未来焦点将是任务完成率、生产稳定性以及与真实工作负载的对齐[31] - 未来竞争的核心不再是智能度,而是可控性、安全性与可观测性[31] - 赢得信任的模型才可能成为真正的生产力,信任的建立是工程化的结果[32]
Meta Platforms Is Considering a Pivot to ‘Closed’ AI Models. What Does That Mean, and Why Don’t META Stock Investors Like It?
Yahoo Finance· 2025-12-16 00:51
Meta Platforms' (META) stock dipped slightly this week following a report that the company is making a significant pivot in its artificial intelligence strategy. The report from Bloomberg says that Meta is developing a closed, monetizable AI model with the codename “Avocado” that could incorporate tech from Chinese companies, including Alibaba Group (BABA). More News from Barchart Such a plan would be a shift in Meta’s AI strategy, which has long favored open-source models such as Llama. Such decentra ...
扎克伯格押注阿里千问,全球AI竞赛格局变了
搜狐财经· 2025-12-12 12:19
文章核心观点 - 中国AI模型,特别是阿里巴巴的通义千问,已在开源生态和软件算法层面具备全球领先实力,并开始向全球输出技术标准和生态,全球AI格局正从“模型为王”转向“应用为王”,并形成“西谷(谷歌)东阿(阿里)”的双巨头格局 [2][18] Meta转向采用中国AI模型 - Meta创始人扎克伯格态度发生180度转变,其新模型“牛油果”(Avocado)项目选择蒸馏阿里巴巴的通义千问开源模型 [3] - 转变源于商业理性与技术现实,Meta实验室发现依赖自研或美国本土模型难以达到最优性能与成本平衡 [5] - 硅谷精英为效率和性能买单,Airbnb CEO称赞千问“比OpenAI更好更便宜”,推特创始人也期待其产品与千问3-Coder结合 [6] 中国开源模型的崛起与领先地位 - 2024年8月,阿里千问模型的衍生模型数量首次超越Meta [5] - 阿里通义团队实行“饱和式开源”策略,已开源300多款模型,实现“全尺寸、全模态”覆盖,支持全球119种语言 [6] - 英伟达CEO黄仁勋指出中国在开源领域遥遥领先,千问的曲线陡峭上升并占据开源模型大部分市场份额 [7] - DeepSeek发布R1时,其6个小尺寸模型中有4个采用了千问进行蒸馏 [5] “西谷东阿”全栈AI格局形成 - 全球范围内,只有谷歌和阿里巴巴真正打通了从底层芯片、云基础设施、大模型到顶层应用生态的完整闭环 [9] - 阿里拥有从底层AI云、中层千问模型矩阵到上层淘宝、高德、钉钉等国民级应用及海量数据的“端到端”全栈AI体系 [11] - 阿里云季度营收同比增长34%,AI相关产品收入连续9个季度实现3位数增长,形成“云+AI”正向飞轮 [12] - 资本市场形成“西谷东阿”共识,一年来阿里股价累计上涨超93%,与谷歌的涨幅(92%)几乎同步 [13] AI竞争转向应用与生态 - AI行业核心趋势正从“炫技”和“模型为王”走向“实用”和“应用为王” [15] - 千问APP自公测以来,仅用23天月活用户数就突破3000万,成为全球增长最快的AI应用,并实现从“陪聊”到“办事”的质变 [16] - 依托千问强大开源基座,中国AI应用在丰富度和渗透率上正以前所未有的速度追赶甚至超越美国 [17] - 未来AI竞争将是生态系统的碰撞,资金将更集中流向兼具“硬科技”(芯片、模型)和“软实力”(应用、生态)的头部玩家 [18][19]
Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?
机器之心· 2025-12-12 11:41
公司战略重心转移 - 公司战略重心已从“元宇宙”全面转向人工智能[1] - 为支持人工智能雄心,正在进行大规模资源重新分配,主要削减对象是负责VR、AR及元宇宙业务的Reality Labs部门[8] 内部冲突与团队摩擦 - 新组建的顶尖人工智能团队与公司原有核心业务部门在资源分配、发展目标及文化融合上产生摩擦[2] - 冲突核心在于人工智能发展的优先事项:长期高管希望利用Instagram和Facebook数据训练模型以优化社交媒体和广告业务;而新团队领导Alexandr Wang认为首要目标是追赶OpenAI和Google,致力于开发超级智能,而非过早关注具体产品应用[5] - 新团队研究人员认为现有高管只在乎改善社交媒体业务,会拖慢前沿人工智能模型的开发进度[5] - 新团队领导曾推动将新人工智能模型设为“闭源”,这与公司以往的开源策略产生争执[5] - 公司发言人否认内部冲突,称管理层在构建超级智能与发展核心业务的目标上保持一致[11] 资源与投资调整 - 公司重组了人工智能业务,并以约143亿美元战略投资了初创公司Scale AI,其创始人随后加入并领导名为“TBD Lab”的新研究团队[4] - 计划将Reality Labs部门明年的预算削减高达30%(约40亿至60亿美元),并可能最早在明年1月进行裁员[11] - Reality Labs部门负责人已被要求从其部门预算中削减20亿美元,这些资金将转移给新的人工智能团队[11] - 公司预计今年在人工智能领域的支出(涵盖数据中心、模型开发等)在660亿至720亿美元区间,这一数字几乎等同于元宇宙业务近年来的亏损总额[11] - 自2020年末以来,Reality Labs已累计亏损超过700亿美元[11] 市场反应与历史背景 - 资源重新分配的消息传出后,公司股价上涨,投资者长期以来一直批评元宇宙投资是昂贵的干扰[11] - 公司早期曾以Llama定义了开源模型的标准,但随着Llama 4的口碑崩盘和人工智能竞赛的日益激烈,开始了大刀阔斧的内部改革[15] - 公司曾同时陷入三场昂贵战役:元宇宙每年烧掉百亿、在短视频存量市场死磕TikTok、在人工智能领域试图追赶Google和OpenAI,资源的极度分散导致了战略焦点的模糊[19] - 外界质疑长期向元宇宙倾斜的算力资源分配,是否拖慢了人工智能团队在关键时刻的冲刺速度[19] 公司面临的挑战与愿景 - 内部紧张局势持续,一部分员工认为公司算力应优先服务于作为“摇钱树”的社交媒体业务,而新晋的人工智能精英则在追求更宏大的技术愿景[12] - 在移动互联网时代,公司受制于Apple和Google的操作系统规则损失惨重,这使其决心在人工智能时代通过构建核心技术平台来“掌握自己的命运”[17] - 公司开源Llama并非为了慈善,而是一套行之有效的成功公式,旨在将自己的技术确立为行业标准,并利用外部生态系统的力量反哺模型[18] - 公司内部“老臣”与“新贵”之间的对立,以及Yann LeCun因理念不合而离职,都预示着组织文化的剧烈阵痛[21] - 目前硅谷闭源模型陷入“无限战争”,没有任何一家厂商能够建立绝对的技术统治力[13]
Meta -2026 年跑赢市场的 3 大催化因素与乐观逻辑
2025-12-15 09:55
涉及的公司与行业 * **公司**:Meta Platforms Inc (META.O, META US) [1][5][6] * **行业**:互联网 [6] 核心观点与论据 * **投资评级与目标价调整**:摩根士丹利对Meta维持“增持”评级,但将目标价从820美元下调至750美元,对应约12%的上涨空间,隐含约23倍2027年预期市盈率 [1][5][6][10][15] 看涨情景目标价为1000美元,隐含约27倍2027年预期市盈率 [1][9][15] * **核心投资论点**:公司正进行结构性转变,专注于多年期的效率、生产力和更精简的运营,这不仅是“效率之年”的短期变化 [23] 同时,核心平台的收入和参与度趋势正在改善 [24] * **三大催化剂**: 1. **收入预期上调**:分析师对2026年和2027年的收入预测分别比市场共识高出2%和4% [3] 第四季度业绩中若能给出优于预期的收入指引,将增强投资者对公司核心平台(参与度和货币化)长期改善前景的信心 [3] 2. **2026年运营支出指引明确化**:尽管将2026年和2027年的GAAP运营支出预测分别上调了5%和6%,至1550亿美元和1870亿美元,但分析师仍看到实现2027年每股收益33美元的路径 [4][8][10] 关键在于公司1月份给出的2026年运营支出指引(结合收入预期)能否让市场对2026/2027年每股收益不低于约30/33美元更有信心 [8] 3. **超级智能团队的模型与货币化节点**:市场尚未充分认可该团队的价值,但其在大型语言模型和产品创新方面的成功可能推动股价达到1000美元的看涨情景 [9] 潜在的创新包括基于Blackwell芯片训练的前沿模型、开源Llama推理模型,以及开发成本效益显著更高的开源模型 [9] 这些进展可能为公司创造新的长期收入流,并推动估值倍数扩张 [9] * **盈利预测调整**:由于运营支出预测上调5%/6%,将2026年和2027年的每股收益预测均下调约8%,目前预测2027年每股收益为33美元 [10] * **估值与比较**:750美元的目标价隐含的估值倍数较同行增长调整后平均倍数有7%的折让,较谷歌当前的增长调整后倍数也有7%的折让 [10] 在基础情景中,Meta的EV/销售额倍数(9.4倍)高于可比公司中位数(8.3倍),但经过增长和利润率调整后的指标(1.19倍)则低于中位数(1.28倍) [15] * **风险与机会**: * **上行风险**:Reels货币化速度快于预期、参与度增长更高、AI投资带来更大收益、订阅和点击发送消息广告推动收入增长、效率提升带来超预期的自由现金流增长 [35] * **下行风险**:参与度下降、Reels货币化进度慢于预期、宏观经济压力/消费者支出疲软、监管影响广告定向能力、Reality Labs亏损进一步扩大、数据中心建设执行失误导致资本密集度升高 [27][35] 其他重要细节 * **市场情绪与估值**:投资者情绪转负,Meta的远期市盈率从今年早些时候的高点约28倍降至约22倍,与长期平均水平一致 [2][11] 相比之下,谷歌的远期市盈率溢价达到33%,为三年最高 [2] * **财务预测关键数据**: * **收入**:预测2025-2027年总收入分别为2005.81亿美元、2402.50亿美元、2833.79亿美元,三年复合年增长率20% [37] 广告收入同期复合年增长率20% [37] * **毛利率**:预计将从2025年的82.1%下降至2026年的74.8%和2027年的73.3% [37] * **运营支出**:2026年GAAP运营支出预测为1553.18亿美元,同比增长33% [13] 增长主要由基础设施成本推动,包括云交易、折旧摊销、能源和人力成本等 [4][13] * **资本支出**:预计2026年和2027年将分别增至1150亿美元和1350亿美元 [13] * **每股收益**:2025-2027年GAAP每股收益预测分别为23.45美元、29.35美元、33.02美元 [37] * **运营指标**:预测总日活跃用户数将从2024年的21.799亿增长至2027年的23.440亿 [29] * **地域收入分布**:北美地区贡献40-50%的收入,欧洲(除英国)贡献20-30%,其他地区各贡献0-10% [31] * **机构持仓**:机构主动所有者占比57.1%,对冲基金行业多空比率2.9倍 [32]
Avocado and AI: How Would a New Model from Meta Platforms Influence the Bull and Bear Cases for META Stock?
Yahoo Finance· 2025-12-12 00:20
Among the most magnificent of the “Magnificent Seven” stocks, Meta Platforms (META) has been a top pick of mine for some time. Most of my own personal bullish thesis has to do with Meta's strong underlying cash flow-generating core business (its social media empire), which has allowed Meta to invest aggressively in new technologies and grow its time share among basically all age groups in the economy (and almost every country around the world). With the majority of the world visiting one of Meta's sites ...
阿里千问成全球开源模型“新标杆”,Meta新项目被曝蒸馏千问
新浪财经· 2025-12-11 20:59
Meta新模型“牛油果”动态 - Meta计划于明年春季推出代号为“牛油果”的新模型项目 该模型很可能以闭源形式发布[1] - “牛油果”模型的训练蒸馏了多方开源模型 包括谷歌的Gemma、OpenAI的gpt-oss以及阿里巴巴的通义千问[1] - Meta CEO马克·扎克伯格密切关注新组建的TBD实验室团队 其态度发生转变 从呼吁支持美国模型转向采用阿里千问[2] 阿里巴巴通义千问的全球影响力与市场表现 - 通义千问Qwen模型在2024年8月衍生模型数首次超越Meta的Llama 并在2025年10月全球下载量实现超越 取代Llama成为全球第一的开源模型[2] - Qwen3-Max旗舰模型性能超过GPT5、Claude Opus 4等国际竞争者 跻身全球前三[3] - 消息传出后 阿里巴巴美股于12月10日上涨1.83% 收于每股158.82美元 总市值达3790亿美元 今年以来股价已涨超90%[2] 通义千问的广泛生态应用 - 亚马逊、Airbnb等公司使用Qwen发展新业务 英伟达、微软、Meta等科技企业基于Qwen开发衍生模型[3] - 斯坦福李飞飞团队、硅谷独角兽Thinking Machines Lab、艾伦AI研究所等机构基于Qwen进行前沿技术创新[3] - 来自韩国、泰国、越南、日本、阿联酋、巴西等全球的公司和开发者使用Qwen开发新模型、新技术和应用[6] - 新加坡国家人工智能计划放弃了Meta模型 转向通义千问Qwen开源架构[6] 阿里巴巴的AI战略与业务进展 - 公司走出了一条完整的AI发展之路 涵盖基模迭代引领、全栈布局加速、生态协同放大[6] - 最新一季财报显示 云计算季度营收同比增长34%至398.24亿元 AI相关产品收入已连续九个季度实现三位数同比增幅[6] - 公司于今年2月宣布投入3800亿元用于AI基础设施建设 并设定了到2032年将云数据中心能耗规模扩大十倍的长期目标[6] - 千问APP自11月17日公测仅23天 月活跃用户数已突破3000万 成为全球增长最快的AI应用 上线一周下载量便突破1000万[6]
昔日开源霸主承认蒸馏阿里千问,世界进入中国AI时间
36氪· 2025-12-11 19:39
全球人工智能开源领域出现标志性事件。12月10日,彭博社的一则报道震动了硅谷——曾经的全球开源霸主Meta公司,其最新AI模型"牛油果"项目正在秘 密使用中国阿里巴巴的千问Qwen开源模型进行蒸馏训练。 这一消息传出后,阿里巴巴股价盘前应声上涨超过4%。 就在一年前,Meta创始人扎克伯格还在公开场合呼吁构建以美国模型为核心的开源生态。如今,面对自身Llama系列增长乏力与东方模型的强势崛起, Meta的这次选择更像一次务实的转身。 开源世界的权力转移早有征兆。2024年8月,Qwen的衍生模型数量首次超越长期霸主Llama;2025年10月,其全球下载量也完成了反超。英伟达CEO黄仁 勋在近期一场演讲中的观察点明了这一趋势:"开源已变得极其重要,而中国在这一领域正展现出领先态势。" 当昔日的规则制定者开始向曾经的追赶者汲取养分,一场深刻的行业变局已经拉开序幕。 一场无声的倒戈:开源王座易主 根据彭博社报道,扎克伯格密切关注的TBD实验室团队,在"牛油果"模型的训练中,蒸馏了包括谷歌Gemma、OpenAI的gpt-oss以及阿里巴巴Qwen在内的 多方开源模型。 这一技术选择背后是Meta自身开源战略面临的 ...