开源模型
搜索文档
在这个开源「从夯到拉」榜单,我终于明白中国 AI 为什么能逆袭
新浪财经· 2025-12-17 22:25
文章核心观点 中国开源大模型在2024年至2025年间实现了全球范围内的领导地位,以DeepSeek、Qwen、Kimi、智谱和MiniMax为代表的国产模型,在性能、价格、生态和可用性等维度上快速逼近甚至超越闭源巨头,正在改变全球AI行业的格局和运行规则 [3][5][116] 全球开源模型排名与格局演变 - 根据AI研究员Nathan Lambert等人的排名,全球开源模型前五名均为中国公司:DeepSeek、Qwen、Kimi、智谱和MiniMax,而OpenAI仅位列第四梯队,Meta的Llama仅获荣誉提名 [3][114] - 2024年曾是Llama主导的天下,但到2025年,国产开源模型已成为全球开发者的默认选择,持续刷新行业选项 [5][116] - 在Hugging Face的热门模型趋势榜上,前四名均为国产开源模型 [86][89] 主要中国开源模型厂商及其技术亮点 - **DeepSeek**:通过混合注意力等机制显著降低成本,打开了高效推理的突破口 [29][98] - **Qwen(阿里巴巴)**:凭借庞大的生态规模,覆盖从4800亿参数到6亿参数的各种尺寸模型,以及视觉语言、代码编写等多领域,几乎渗透整个开源市场 [23][131] - **Kimi(Moonshot AI)**:2025年11月发布万亿参数的混合专家模型Kimi K2 Thinking,采用交错思考技术,一次性能执行300次工具调用,在多个榜单上超越GPT-5和Claude 4.5 [11][122][135] - **MiniMax**:2025年10月底发布MiniMax M2混合专家模型,在综合榜单排名第五,超越Gemini 2.5 Pro和Claude Opus 4.1,其API定价为每百万输入/输出token 0.3美元/1.2美元 [14][124][127][185] - **智谱(Zhipu AI)**:发布GLM系列模型,如GLM-4.5和GLM-4.6,丰富了国产开源生态 [9][10][120] 国产开源模型的竞争优势与市场反馈 - **性能与成本**:国产模型在保持高性能的同时,具备极具竞争力的价格,例如MiniMax M2的价格仅为Anthropic Sonnet模型的1/12 [127][185] - **开发者认可**:海外社交媒体上广泛认可国产模型“好用、便宜”,成为小公司和副业项目的开发首选 [14][124] - **企业应用**:爱彼迎CEO公开表示,中国的开源模型Qwen比OpenAI更适合其实际工作,且更便宜 [25][134] - **具体能力展示**:实测显示,MiniMax M2能一次性生成功能齐全的棋类应用或网站,在处理包含20714个岗位、大小10MB的Excel数据时也表现出色 [16][18][30][35][138][141] 技术路径选择:全注意力与高效注意力之争 - MiniMax M2选择了传统的“全注意力机制”,而非当前流行的稀疏或高效注意力机制,主要原因是全注意力在工业级系统中的性能和可靠性仍然更高 [38][75][144][181] - 高效注意力机制(如线性、稀疏注意力)的核心目标是节省有限的计算资源,但其在复杂推理任务中可能存在隐藏缺陷,且相关基础设施尚不成熟 [41][44][57][147][150][163] - 随着上下文长度需求增长和GPU算力增速放缓,高效注意力的优势未来可能显现,但当前阶段,在质量、速度、价格三角中寻求平衡是关键 [62][75][168][181] 国产开源崛起的驱动因素与行业影响 - **内部竞争与算力限制**:国内模型厂商众多、竞争激烈,且面临算力紧张、芯片受限的困境,开源成为共享算力、避免重复建设、吸引开发者的有效策略 [93] - **构建完整生态**:各厂商通过不同的技术路线(如DeepSeek的成本控制、Qwen的生态规模、MiniMax的智能体能力)共同构建了一个庞大而完整的开源系统,形成了合力 [29][84][97][98] - **改变全球格局**:国产开源模型已成为全球AI生态的底座,全球小团队使用Qwen微调、用DeepSeek做推理基座、用MiniMax做智能体验证已成为常态,导致全球开源生态中心向中国倾斜 [98][109] - **数据佐证**:a16z数据显示,国产开源模型的累计下载量已超过美国模型,且领先优势持续扩大;斯坦福大学2025年AI指数报告也预示国产开源性能将超过闭源和美国模型 [95][97]
小米天才少女罗福莉首秀,称小米开源模型全球前二
金融界· 2025-12-17 10:57
公司动态 - 小米集团于2025年举行“人车家全生态合作伙伴大会” [1] - 小米集团高管罗福莉首次在该大会上公开亮相 [1] 技术能力 - 小米集团高管罗福莉称,公司开源模型的代码能力和智能体(agent)能力,在世界级公开公正的评估榜单上,已经进入全球前两名 [1]
英伟达成开源新王?Nemotron 3全新混合专家架构,推理效率升4倍
机器之心· 2025-12-16 16:55
英伟达发布Nemotron 3系列开放模型 - 公司发布了Nemotron 3系列开放模型,包含Nano、Super和Ultra三种规模,旨在应对企业从单一模型转向多智能体AI系统时面临的挑战 [2][7][8] - 该系列模型的核心目标是提供构建专业级智能体AI所需的性能与开放性,创始人黄仁勋强调开放式创新是AI进步的基石 [8] - Nemotron 3 Nano(30B-3A)模型已于发布日上线,而Super和Ultra型号预计将于2026年上半年正式推出 [8] 各型号模型规格与定位 - **Nemotron 3 Nano**:总参数316亿,激活参数32亿(含嵌入层为36亿),针对软件调试、内容摘要等任务优化,是计算成本效率最高的模型 [3][5] - **Nemotron 3 Super**:参数规模约1000亿,每个token最多激活100亿参数,擅长需要大量协作智能体且对低延迟要求极高的复杂任务 [4][5] - **Nemotron 3 Ultra**:参数规模约5000亿,每个token最多激活500亿参数,作为高级推理引擎,适用于深度研究与战略规划等高复杂度AI工作流 [4][5] Nano型号的性能提升与优势 - 与上代Nemotron 2 Nano相比,Nemotron 3 Nano实现了最高4倍的Token吞吐量提升,并将推理阶段生成的Token数量减少最高60% [3] - 其激活的参数数量不到上代的一半,却实现了更高的准确率,并具备100万Token的上下文窗口以增强长期记忆能力 [3] - 在单张H200、8K输入/16K输出配置下,其推理吞吐量是Qwen3-30B-A3B的3.3倍,是GPT-OSS-20B的2.2倍 [28] 核心技术:混合MoE与架构创新 - 系列模型采用Mamba-Transformer混合MoE架构,大量采用MoE层与成本更低的Mamba-2层交替堆叠,避免了传统自注意力层KV Cache线性增长的成本 [12] - 引入了LatentMoE架构,先将token投影到更小的潜在维度进行专家路由和计算,以减少专家权重加载和通信成本,并增加专家数量 [16] - 采用了多Token预测技术,一次预测多个未来token以提升准确率和推理效率,该技术仅引入极少量额外FLOPs并能带来可观的推测解码加速收益 [18][19] 训练与精度格式创新 - 公司在NVFP4数值格式下,成功实现了在Mamba-MoE混合架构上对最高25万亿tokens的稳定高精度预训练 [21] - 在GB300芯片上,FP4的峰值吞吐量是FP8的3倍,这使得在现有基础设施上训练更大规模模型成为可能 [21][37] - 模型权重、激活值和梯度均被量化为NVFP4,使得前向传播、反向传播中的梯度计算和权重更新都可以使用NVFP4 GEMM运算 [21] 超长上下文与实用能力增强 - 系列模型支持最长100万token的上下文长度,以满足大规模、多轮、具备Agentic推理的应用需求 [22] - 通过使用Mamba层天然的隐式位置信息,在注意力层中完全不使用旋转位置编码,从而避免了RoPE带来的上下文扩展限制 [22] - 引入了多环境强化学习后训练,以及推理阶段精细化推理预算控制,增强了模型在真实世界应用中的可靠性、灵活性与泛化表现 [23] 模型性能表现 - 在覆盖多个类别的主流基准测试中,Nemotron 3 Nano-30B-A3B的准确率优于GPT-OSS-20B和Qwen3-30B-A3B-Thinking-2507 [27] - 在不同上下文长度下的RULER基准测试中,其性能均优于GPT-OSS-20B和Qwen3-30B-A3B-Instruct-2507 [29] - 独立AI基准评测机构Artificial Analysis将其评为同规模模型中最开放、最高效的模型之一,并具备领先的准确率 [30] 开放生态与配套工具 - 公司不仅开源了模型,还发布了训练数据、强化学习环境和训练代码,斯坦福大学教授认为这能让用户创建自己的模型,意义重大 [6][31] - 同步发布了囊括3万亿Token的全新预训练、后训练及强化学习数据集,以及Nemotron智能体安全数据集,用于打造专业化领域智能体 [39] - 开源了NeMo Gym与NeMo RL库,并推出NeMo Evaluator,所有工具和数据集已在GitHub和Hugging Face上开放 [41] - 该系列模型已获得LM Studio、llama.cpp、SGLang和vLLM等项目的支持 [41]
英伟达发布Nemotron 3开源模型系列
美股IPO· 2025-12-16 08:26
产品发布与核心特性 - 英伟达发布最新开源人工智能模型系列Nemotron 3,旨在为各行业提供透明、高效、可定制的智能体AI开发能力 [1][3] - Nemotron 3系列包含Nano、Super和Ultra三个版本,分别拥有300亿、1000亿和约5000亿参数,适用于不同复杂度的任务场景 [9] - 模型引入突破性的混合潜在专家混合架构,显著提升推理效率并降低运行成本 [1][3] - 模型具备100万token的上下文长度,能在大型代码库、长文档等场景中持续推理,提升事实一致性并减少上下文碎片化 [10] 性能与效率提升 - 在Artificial Analysis Intelligence Index v3.0基准测试中,Nemotron 3 Nano在同规模模型中以52分排名领先 [4][19] - 与上一代Nemotron 2 Nano相比,新设计最多可实现4倍的token吞吐量提升,并将推理token生成量最多减少60%,显著降低推理成本 [12] - 采用的混合Mamba-Transformer专家混合架构,在处理长文本时能保持内部状态并降低计算成本,避免为每个token生成庞大的注意力映射和键值缓存,从而运行更快、内存占用更低 [11][13] - 为Super和Ultra模型引入的“潜在MoE”技术,在相同推理成本下可调用多达4倍数量的专家,实现更高水平的专门化 [13] - 模型还采用了多token预测技术,可一次预测多个未来token,提升长推理序列和结构化输出的吞吐效率 [16] - Super和Ultra模型采用4位NVFP4训练格式,使其能在现有基础设施上完成训练而不牺牲准确性 [18] 市场定位与行业影响 - 英伟达创始人兼CEO黄仁勋表示,开放式创新是AI进步的基础,Nemotron旨在将先进AI转变为开放平台 [6] - 公司目标是为开发者提供一个“可以信赖的模型”,并将其作为“库”来对待,在软件工程层面作出长期承诺 [25][26] - 随着Meta可能转向闭源路线,英伟达或将成为美国最主要的开源模型提供商之一 [24] - 开源的Nemotron 3使初创公司能更快构建和迭代AI智能体,加速从原型到企业级部署的创新过程,多家风投旗下的被投公司正探索使用该模型 [26] - 开发者可在同一工作流中将任务在前沿闭源模型与Nemotron模型之间路由分配,以在最大化智能水平的同时优化token成本 [26] 早期采用者与配套工具 - Nemotron 3的早期采用者包括埃森哲、CrowdStrike、德勤、安永、甲骨文云基础设施、Palantir、Perplexity、ServiceNow、西门子以及Zoom等知名企业 [10] - 作为发布的一部分,英伟达将开放更多研究资源,包括研究论文、示例提示词和开放数据集 [21] - 公司推出了全新的强化学习实验环境NeMoGym,让客户可以在模拟环境中测试模型和智能体在后训练阶段的表现 [21][22] - 英伟达计划发布的后训练数据样本在规模上比任何现有数据集都大得多,且使用限制宽松、开放程度很高 [22] 市场反应 - 受此消息推动,英伟达股价周一开盘上涨近1.7%,报177.97美元 [1][6]
美股三大指数集体高开
第一财经· 2025-12-15 22:49
美股市场整体表现 - 12月15日美股三大指数集体高开,道琼斯工业平均指数上涨160.04点至48618.09点,涨幅0.33% [1][2] - 纳斯达克指数上涨138.55点至23333.72点,涨幅0.60% [1][2] - 标普500指数上涨30.82点至6858.23点,涨幅0.45% [1][2] 热门个股及板块动态 - 热门中概股多数下跌,纳斯达克中国金龙指数下跌0.5%,其中百度下跌超过2%,阿里巴巴和理想汽车下跌超过1% [3] - 特斯拉股价上涨超过2%,公司确认在美国得州奥斯汀进行取消安全员的无人驾驶网约车测试 [3] - 英伟达股价上涨超过1%,公司发布了Nemotron 3系列开源模型 [3] iRobot公司重大事件 - 扫地机器人制造商iRobot股价暴跌近70%,盘初触发熔断,股价下跌3.000美元,跌幅69.44% [4][5] - 公司申请破产并将被其代工制造商Picea Robotics收购 [4] - 交易数据显示,iRobot当日成交量为4365.31万股,换手率达137%,市值约为4201万美元 [5][6]
英伟达发布Nemotron 3开源模型系列
华尔街见闻· 2025-12-15 22:03
文章核心观点 - 该文档仅包含风险提示及免责条款,未提供任何关于公司、行业、新闻事件、财务数据或市场动态的具体内容 [1] - 文档明确指出其不构成投资建议,未考虑用户的特定状况,投资责任由用户自行承担 [1] 根据相关目录分别进行总结 - 文档中未包含可分析的行业趋势、公司业绩、财务数据、市场事件或潜在投资机会等实质性内容 [1] - 所有与公司运营、行业发展、财务表现或战略动向相关的具体信息均缺失 [1]
打破霸主神话,中国AI横扫美国硅谷
新浪财经· 2025-12-15 01:21
事件概述 - Meta公司被曝在研发其闭源大模型“牛油果”时,使用了阿里巴巴集团的开源大模型“通义千问”进行训练,且未事先与阿里沟通或获取授权[1][4] - 该事件因Meta公司此前在开源与知识产权问题上的公开立场,以及其高管强调美国AI领先的言论,而显得极具戏剧性和讽刺意味[1][4] Meta公司的行为与困境 - Meta公司被指行为存在“双标”:公开倡导开源、自由分享并批评闭源阻碍创新,但自身却使用中国开源模型来训练其闭源收费产品“牛油果”[4] - 这一行为暴露了Meta在AI战略上的实际困境:尽管投入巨额资金(如Llama 4砸了几百亿)和算力,但在技术落地和生态支撑上面临挑战[4][13] - 公司内部发生权力交替,AI奠基人、图灵奖得主杨立坤离开,28岁的亚历山大王空降成为首席AI官并掌握实权,这一变动为事件增添了象征意义[5] 阿里巴巴通义千问的实力与表现 - 通义千问是全球领先的开源大模型,累计下载量已突破7亿次,其衍生模型数量在2024年8月超越Llama,下载量于2025年10月完成反超[4][8] - 模型性能强劲:Qwen3-30B版本在MMLU-Redux知识测试中得分91.4,在MMLU-Pro中得分80.9,在编程、多模态理解等场景错误率低于Llama 4[6] - 具备“芯片-云-模型”全栈能力:底层有自研含光800芯片,中层有阿里云提供算力,上层有全系列模型,带来显著的降维打击成本优势[6] - 应用落地能力强大:已被新加坡政府选用,亚马逊用于操控人形机器人,Airbnb用于推荐算法,其APP公测23天月活即破3000万[8][14] - 阿里云AI相关收入已连续九个季度实现三位数增长,市场份额超过第二到四名总和[7] 行业格局与趋势变化 - 全球AI竞争格局生变:开源世界的中心发生位移,中国AI从“跟跑者”转变为“规则制定者”[9][15] - 中国AI选择了“开源+应用”的路径,通过全球开发者社区优化和真实场景驱动快速迭代,这与美国公司主要依赖“闭源”和堆算力烧钱的模式形成对比[9][13][15] - 英伟达CEO黄仁勋指出,中国在开源领域遥遥领先,阿里通义千问已占据开源模型大部分市场份额并“断层领先”[10] - 通义千问正被新加坡、巴西、阿联酋等国视为“AI基础设施”,硅谷创业公司也多有使用其进行原型开发[15] - 市场反应积极:阿里巴巴股价一年内上涨93%,在Meta“偷师”消息传出后,阿里盘前股价直接上涨4%[15]
AI赛道竞争多维深化,生态应用格局加速演进
华金证券· 2025-12-12 16:18
报告行业投资评级 - 行业投资评级为“领先大市”,且评级为“维持” [4] 报告核心观点 - 核心观点认为AI赛道竞争正向多维度深化,生态应用格局正在加速演进 [2] - AI创作与推理应用已进入高速增长期,编程与角色扮演成为核心使用场景,中国开源模型崛起正带动多模态、端侧AI及智能体(Agent)等技术向产业化落地演进 [7] AI创作赛道市场表现 - 2025年11月,AI创作Web端产品总访问量超过2700万,总独立访客数超过770万 [7] - 头部产品优势明显,即梦AI和稿定AI的web端活跃用户超过百万 [7] - 部分产品增长迅猛,可灵AI的月活跃用户相比10月增长超50%,即梦AI新增下载量环比翻倍并重新突破千万,Canva可画、可灵AI等下载增速超100% [7] - 用户使用深度显著,多款产品平均使用时长达8分钟以上,其中Kuaizi平均访问时长近26分钟,度加创作工具达22.3分钟 [7] - 在AI视频生成细分赛道,共5款应用11月访问量超30万,包括即梦AI、可灵AI、Vidu AI等 [7] - APP端表现突出,美图秀秀平均日活跃用户近1800万,醒图、即梦AI分别超460万和超310万 [7] AI技术竞争与发展格局 - AI发展进入“大分流”阶段,竞争向多维度深化 [7] - 开源模型流量占比已达30%,成为特定场景的首要选择,其中中国开源模型占据全球开源模型流量近30% [7] - 推理优化模型主导,流量占比超50%,AI正从“生成文本”转向“思考问题” [7] - 主要使用场景为编程和角色扮演:编程类请求占比从2025年年初的11%飙升至50%以上;在开源领域,角色扮演占据开源模型流量的52% [7] - DeepSeek的流量中,超2/3为角色扮演和闲聊 [7] - 多模型生态格局逐渐清晰:闭源模型更多承担高价值、与收入强关联的工作负载;开源模型则更侧重于低成本、高并发的任务需求 [7] - 竞争已由单纯的技术竞赛转向关于场景适配、成本控制与生态构建的综合竞争 [7] AI应用扩展与技术趋势 - Agent(智能体)正在成为下一代AI范式,具备感知-规划-执行闭环能力,开发门槛因代码生成与框架支持而降低 [7] - 多模态融合逐步成熟,支持文本、图像、视频一体化生成,提升3D、视频等内容生产效率 [7] - 端侧AI生态快速发展,设备本地化部署兼顾低延迟与隐私保护 [7] - 整体趋势指向服务主动化、交互自然化与软硬件协同,推动AI从效率工具向智能伙伴演进 [7] - 中国正从AI领域的参与者向引领者转变:全球平台Hugging Face上,智源研究院和阿里巴巴的开源模型下载量分别达7.90亿次和7.49亿次 [7] - 应用层面,DeepSeek用户数已突破1亿,通义千问成为重要的开源基座模型 [7] 投资建议 - 建议关注蓝色光标、昆仑万维、天娱数科、因赛集团、视觉中国、汇量科技等公司 [7]
阿里千问成全球开源模型“新标杆”,Meta新项目被曝蒸馏千问
新浪财经· 2025-12-11 20:59
Meta新模型“牛油果”动态 - Meta计划于明年春季推出代号为“牛油果”的新模型项目 该模型很可能以闭源形式发布[1] - “牛油果”模型的训练蒸馏了多方开源模型 包括谷歌的Gemma、OpenAI的gpt-oss以及阿里巴巴的通义千问[1] - Meta CEO马克·扎克伯格密切关注新组建的TBD实验室团队 其态度发生转变 从呼吁支持美国模型转向采用阿里千问[2] 阿里巴巴通义千问的全球影响力与市场表现 - 通义千问Qwen模型在2024年8月衍生模型数首次超越Meta的Llama 并在2025年10月全球下载量实现超越 取代Llama成为全球第一的开源模型[2] - Qwen3-Max旗舰模型性能超过GPT5、Claude Opus 4等国际竞争者 跻身全球前三[3] - 消息传出后 阿里巴巴美股于12月10日上涨1.83% 收于每股158.82美元 总市值达3790亿美元 今年以来股价已涨超90%[2] 通义千问的广泛生态应用 - 亚马逊、Airbnb等公司使用Qwen发展新业务 英伟达、微软、Meta等科技企业基于Qwen开发衍生模型[3] - 斯坦福李飞飞团队、硅谷独角兽Thinking Machines Lab、艾伦AI研究所等机构基于Qwen进行前沿技术创新[3] - 来自韩国、泰国、越南、日本、阿联酋、巴西等全球的公司和开发者使用Qwen开发新模型、新技术和应用[6] - 新加坡国家人工智能计划放弃了Meta模型 转向通义千问Qwen开源架构[6] 阿里巴巴的AI战略与业务进展 - 公司走出了一条完整的AI发展之路 涵盖基模迭代引领、全栈布局加速、生态协同放大[6] - 最新一季财报显示 云计算季度营收同比增长34%至398.24亿元 AI相关产品收入已连续九个季度实现三位数同比增幅[6] - 公司于今年2月宣布投入3800亿元用于AI基础设施建设 并设定了到2032年将云数据中心能耗规模扩大十倍的长期目标[6] - 千问APP自11月17日公测仅23天 月活跃用户数已突破3000万 成为全球增长最快的AI应用 上线一周下载量便突破1000万[6]
Meta上亿年薪的研究员们,却在偷师中国开源模型
观察者网· 2025-12-11 18:17
公司动态与战略调整 - Meta组建名为TBD Lab的新团队,其正在训练的“牛油果”(Avocado)模型使用了包括谷歌Gemma、OpenAI GPT-oss和阿里巴巴Qwen在内的多个第三方模型,该模型预计于明年春季首次亮相并可能作为闭源模型推出 [1] - 针对相关报道,Meta发言人回应称模型训练工作正按计划进行,时间表没有发生有意义的变更 [1] - 消息曝光后,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [1] - 因Llama 4表现不佳,Meta在最新一季度财报会上仅轻描淡写地提及Llama一次,该模型已不再是公司焦点 [5] - 扎克伯格随后对公司内部进行人事调整,拥有20年工龄的首席产品官Chris Cox在Llama 4翻车后被撤掉AI部门管理权限,部分Llama 4团队成员也被边缘化 [5] - 扎克伯格亲自挂帅开启AI“梦之队”招聘计划,从外部高薪挖来Scale AI创始人Alexandr Wang担任新的人工智能负责人,执掌全新的TBD实验室,并开出亿元薪酬大肆挖角同行 [5] - 公司更直接叫停了部分激进的元宇宙项目,以集中资源与OpenAI等竞争对手较量,对名为“牛油果”的新AI模型可谓孤注一掷 [6] - Alexandr Wang作为闭源模型的拥簇者,被认为是Meta新模型转向闭源的核心原因 [6] - 在Alexandr Wang领导下,Meta Superintelligence Lab在11月几乎毫无动作 [11] 行业竞争格局演变 - 过去两年,Meta通过开源Llama系列成功扮演了“反OpenAI联盟”的盟主,Llama一度被视为开源界的Linux,是全球开发者(包括中国开发者)的首选底座 [2] - 这一格局在2025年开始瓦解,随着年初DeepSeek开源模型的横空出世,以及后续阿里Qwen、月之暗面、智谱、Minimax等AI新势力纷纷发布高性能开源模型,Meta对开源生态的统治地位开始摇摇欲坠 [3] - 2025年4月,Meta发布的Llama 4性能未获开发者认可,且模型在LMArena的榜单排名被曝出存在“作弊嫌疑”,进一步饱受负面评价 [3] - 从性能角度看,无论是中国的“AI六小龙”还是阿里等互联网大厂,其最新的开源模型发布时均选择性能对标OpenAI、Google等头部闭源模型,Meta的Llama系列模型甚至已不配作为参照组来展示性能 [3] - 在下载和衍生模型数量上,阿里Qwen模型对Meta实现了赶超,2024年8月,千问的衍生模型数量第一次超过Llama,到了2025年10月,千问模型在全球下载量上也正式超过了Llama [4] - 这意味着Meta无论在数量还是质量上都失去了全球开源模型老大的地位 [4] - 华尔街投行KeyBanc资本市场的分析师在11月的报告中写道,在某种程度上,Meta的AI之路恰恰与Alphabet相反:年初被视为AI赢家,但现在投资回报和战略方向却成了最大的问号 [10] - 美国媒体CNBC在报道中表示,真正具有突破性的AI产品不会出现在小团队手中,而是出现在那些掌握完整生态体系的企业里 [10] - Meta今年成为了美国资本市场上最让人失望的AI股之一 [10] 市场反应与舆论评价 - 社交媒体上,网友们对Meta花上亿美元挖角的员工们选择使用Qwen开源模型进行了大量调侃,有网友直言“花了数十亿美元雇AI研究员,敢情就是为了抄作业?” [6][9] - 扎克伯格过去多次借鉴抖音、微信等中国产品功能,本次使用千问模型被视作一个巨大的“回旋镖” [10] - 扎克伯格在今年年初的播客中曾警告,如果不进行开源对抗,世界将被“反映中国价值观”的AI模型所主导,而他本人也多次在公开场合渲染“中国科技威胁论”,在国会听证会上曾是唯一一个对中国窃取技术问题表现出强硬攻击姿态的硅谷CEO [10] - Meta在打造下一代闭源模型时向Qwen“取经”,某种程度上宣告其亲自承认了Llama在开源领域的统治力已经被终结 [10] - 从开源盟主到闭源追随者,从“中国威胁论”到“偷师”中国同行,Meta的“牛油果”尚未发布就已经舆论缠身,这被视作是硅谷面对中国AI快速崛起时集体焦虑的一个缩影 [11]