Workflow
闭源模型
icon
搜索文档
Llama 4被图灵奖得主曝作弊刷榜,Meta开源AI帝国一夜倾覆
钛媒体APP· 2026-01-11 19:49
文章核心观点 - Meta公司因Llama 4模型在基准测试中作弊及内部管理混乱、技术路线摇摆而陷入危机 导致其首席科学家杨立昆离职、FAIR团队被裁 公司正放弃长期坚持的开源战略 转而孤注一掷地开发名为“Avocado”的闭源模型 其2026年的AI命运将取决于此款模型能否成功 [1][2][3][4][21][22] Meta内部管理与技术路线问题 - Meta前首席科学家杨立昆证实 团队为优化Llama 4的基准测试结果 对不同评测使用了不同版本的模型 结果被篡改 [1][4] - 杨立昆离职源于与公司在大语言模型技术路线上存在根本分歧 他信奉世界模型 而公司则全力投入大语言模型 [4] - FAIR前技术总监田渊栋及其团队被裁 他指责Llama 4的研发是“外行领导内行” 并透露自己是在项目发布前2个月被临时拉来“救火” [2][8][14][15] - 田渊栋自嘲接手项目后 最终结果超出了他预想的四种可能 而是得到了“被裁掉”的第五种可能 [17] - 公司内部管理混乱 从Llama 3末期开始 高层过度强调“技术产品化” 急于将AI整合进各应用 导致研发资源严重向多模态和应用适配倾斜 忽视了底层推理能力 [13][15] - 公司曾研究思维链技术 但因FAIR与产品组缺乏良性互动及高层痴迷“技术产品化” 导致自研成果被埋没 错失先机 [15] 核心团队变动与战略转向 - 杨立昆已于2025年年底离职 [4] - 2025年7月 公司以约4年3亿美元的薪酬包与顶级资源挖来OpenAI研究员Jason Wei与Hyung Won Chung [19] - 公司以143亿美元收购Scale AI 49%的股权 并扶持其28岁的创始人Alexandr Wang成为Meta首席人工智能官 [19] - 扎克伯格亲手拆解了耗时十年建立的科研体系 裁撤旧体系并重金引入外部人才 [18][19][20] - 随着Llama 4溃败 公司基本宣告放弃长期开源战略 转向开发闭源模型“Avocado” [2][21] - 公司正从“理想主义开源先锋”向“务实闭源追随者”转型 在行业中的位置从引领者滑落为焦虑的追赶者 [21] Llama系列模型的兴衰与行业竞争 - Llama 2和Llama 3曾是该公司的骄傲 凭借开源策略在AI界受到尊重 Llama 3在多项指标上能与GPT-4竞争 [12][13] - Llama 4推出后表现不佳 社区开发者怀疑其宣称的性能靠“刷榜”取得 [17] - 外部竞争加剧 OpenAI推出基于思维链的o1模型 中国的DeepSeek以MOE架构横空出世 具备强悍推理能力与极低成本 打破了硅谷大厂的成本壁垒 [15] - 公司新模型“Avocado”放弃了纯粹自研路径 试图融合谷歌Gemma、OpenAI的技术亮点 并被曝使用阿里巴巴的通义千问进行优化 [2][21] 未来展望与风险 - 2026年春季Avocado的发布将是决定公司AI成败的关键 如果这款“博采众长”的闭源模型无法实现性能突破 公司可能在超级智能的竞赛中彻底掉队 [3][22] - 公司将AI命运几乎全部压在了拼凑而成的Avocado模型上 [3]
“短缺终将导致过剩”!a16z安德森2026年展望:AI芯片将迎来产能爆发与价格崩塌
硬AI· 2026-01-08 12:24
AI技术变革的宏观定位 - AI是比互联网更宏大的技术变革,其量级可与电力、微处理器和蒸汽机相提并论,目前仍处于“非常早期”阶段 [3][11][23] - 智能的单位成本正以远超摩尔定律的速度下降,形成“极度通缩”,这将推动需求的爆发性增长 [4][13][41] - 基础设施(如GPU、数据中心)的短缺将引发数千亿甚至数万亿美元的大规模建设,最终导致供应过剩,进一步压低AI成本 [2][5][13][41] 市场结构与竞争格局 - 未来AI行业结构将类似计算机产业:顶端是极少数类似超级计算机的“上帝级模型”,边缘侧将普及海量低成本的小模型 [6][19][48] - AI领域实质上是中美双雄争霸的局面,世界其他国家要么造不出来,要么不想造 [6][57] - 中国在AI领域的追赶速度惊人,例如DeepSeek的发布被形容为“超新星时刻”,其开源策略和芯片自研进展对全球竞争格局产生影响 [6][13][60] 商业模式与定价演进 - AI应用正从“按Token付费”向“基于价值定价”转移,初创公司在定价上比传统SaaS公司更具创造力 [7][17][38] - 高定价可能对客户有益,因为它能支撑更好的研发,使产品变得更好 [82] - 领先的AI应用公司(如Cursor)正在向后集成,构建自己的专用模型,而不仅仅是做大模型的“套壳” [7][17][97] 技术发展路径与扩散 - 大模型与小模型并非零和博弈,而是一个分工明确的“智力金字塔”,两者将共存 [19][48][89] - 开源模型(如中国的Kimi)正快速追赶闭源大模型的能力,并能以更低的成本在本地硬件上运行,加速了技术扩散 [46][86][87] - AI技术的民主化程度极高,全球最先进的文本、视频、音乐AI(如ChatGPT、Sora、Suno)已打破壁垒,任何人都能第一时间使用 [7][28] 行业动态与初创公司生态 - 新一代AI公司的营收增长和起飞速度是前所未有的,真实需求正快速转化为银行账户中的收入 [19][32] - 初创公司生态极其活跃,不仅有应用公司爆炸式增长,也出现了新的基础模型公司(如由Ilya Sutskever、Mira Murati创立的公司) [92][93] - 风险投资机构采取投资组合策略,同时押注大模型与小模型、专有与开源、基础模型与应用等多种看似矛盾的方向,以捕捉技术变革的机遇 [20][106][108] 地缘政治与监管环境 - 中美AI竞赛促使美国联邦层面的监管风向转变,两党都少有兴趣做任何可能阻碍美国战胜中国的事情,严苛监管风险已大幅降低 [14][64][65] - 监管焦点从联邦层面转移到各州(如加州的SB 1047法案),但存在监管割裂的风险,业界正推动由联邦政府主导监管 [65][68] - 欧盟的《AI法案》被视为过度监管,扼杀了本土AI发展,甚至导致苹果和Meta拒绝在欧洲发布最新功能,欧盟正试图进行修正 [8][69][70]
中国开源AI逆袭,美国围堵失效,半数美企为何集体倒戈?
搜狐财经· 2025-12-27 14:11
美国对中国AI的围堵与市场反应 - 美国通过高端芯片禁运和闭源模型技术壁垒试图限制中国AI发展[1][2] - 超过一半的美国初创企业将中国开源AI模型作为开发首选 市场风向发生反转[4] - 硅谷明星公司如AI独角兽Perplexity和Airbnb公开使用并依赖中国模型技术[4][6] 中国开源模型在美企及学术界的应用现状 - Perplexity的底层技术搭建在中国模型上 Airbnb的AI客服系统重度依赖阿里的Qwen模型[6] - 斯坦福大学使用Qwen作为基座进行推理模型研究 英伟达使用Qwen生成高质量合成数据训练自家AI[8] - DeepSeek GLM Kimi等中国开源模型在硅谷工程师中普及 成为办公室标配[6] 美国企业选择中国开源模型的核心原因 - 成本优势显著 有美国创业者从闭源模型切换至Qwen后 每年节省约40万美元的API调用费[10] - Dayflow测算显示 闭源模型人均年成本超1000美元 而中国开源模型近乎免费[12] - 开源模型提供控制权与数据安全 代码公开可自由修改 数据无需外传 避免了闭源模型如ChatGPT因规则调整导致系统瘫痪的风险[12][14] 中国开源模型的竞争力来源与发展路径 - 受美国高端GPU供应限制 中国团队被迫在算法上创新 致力于用更少算力获得更好效果 例如DeepSeek团队仅用560万美元就训练出高性能模型[18][20] - 中国模型发展出如MoE MLA等高效算法 实现了对算力极限的压榨 与美国企业烧钱拼参数的模式形成对比[20] - 中国开源模型正从工具转变为全球性基础设施 吸引全球百万级开发者进行二次开发 构建生态[22] 开源模式对技术竞争格局的影响 - 开源与闭源成为世界大模型竞赛的关键路线之争[24] - 中国通过将技术转化为全球共享的公共产品 以开源生态共建应对技术壁垒和闭源垄断[24] - 中国AI模型凭借成本低 效率高 更自由的市场竞争力 从可选工具转变为全球AI生态中的刚需基建[26][28]
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 17:46
文章核心观点 - 金融业应主动融入国家“人工智能+”行动,通过平衡开源与闭源模型、协同决策式与生成式AI、优化算力供给与保障安全性等多维路径,提升人工智能应用的普惠性,推动技术与业务深度融合,最终提升金融服务质效和内部管理效能 [3][4][5][8][9] 开源模型与闭源模型 - 开源模型意味着技术平权和自主可控,通过分布式协同创新降低企业应用成本,提升AI普惠性,但存在模型迭代速度较慢、幻觉率较高的特点 [4] - 闭源模型在稳定性和可靠性上相对更高,同等参数规模下性能可能更优,服务支持更成熟,但自主定制化程度受限且模型透明度较低 [4] - 金融业应重点考虑“AI+”应用而非自建大模型,融合开源与闭源优势,围绕场景建设提升服务质效和管理效能 [4] - 以农业银行为例,采取“两条腿走路”策略:在普惠服务、办公等领域加快探索应用开源模型以提高普及率;同时通过本地化部署闭源模型,在客户服务、知识优化推荐等场景确保数据隐私和极致体验 [4] 决策式AI与生成式AI - 决策式AI擅长“确定性优化”,在强可解释性和准确性要求高的场景中仍是最优选择,目前金融业应用占比超过八成,主导风险评估、算法交易和欺诈检测等核心业务领域 [5] - 生成式AI擅长“可能性涌现”,在开放式和创意性场景中泛化能力更好,主要应用于智能客服、知识助手、报告撰写等非核心业务领域 [5] - 随着大模型能力增强、生态完善和算力突破,生成式AI应用可能实现指数级增长,并与决策式AI协同,形成以智能体为主的通用范式,二者边界趋于模糊 [5] - 多智能体配合的“双AI”编排协作模式能更好实现AI能力普惠化,例如在客户营销中,用决策式AI构建客户画像,用生成式AI形成个性化服务方案,提升服务精准性和获得感 [5] AI普惠与算力供给 - AI普惠性提升导致数据处理规模和复杂度指数级增长,数据中心计算量膨胀速度将远大于CPU处理效率进化速度,AI大规模应用意味着进入加速计算时代 [7] - GPU凭借强大并行计算能力能高效应对计算密集型任务,未来通用计算将退化为“控制平面”,高时效高计算负载场景由专用加速计算实现 [7] - AI加速普及过程中,GPU算力需求与供给将始终处于“紧平衡”状态,从绿色发展角度看这种平衡是必要的 [8] - 需从存量挖潜和增量扩容两端发力平衡矛盾:一方面通过算力灵活调度、参数合理匹配、模型压缩加速等工程化手段降低运行成本;另一方面加快建设支持AI高性能计算的智算中心 [8] - 以农业银行为例,依托“农银智+”平台构建参数多样、能力丰富的模型矩阵,通过模型蒸馏、微调等手段精细化匹配业务并充分利用GPU资源,同时建设支持多类型GPU组合的算力云平台,保障AI算力弹性、韧性和可持续供给 [8] 普惠性与安全性 - 提升AI应用普惠性同时必须高度重视安全性,需强化AI稳定性以保障大众利益,未来AI将成为数字世界“基础设施”,需建立模型安全护栏、主动防御等技术手段应对提示词注入、资源消耗攻击等风险,保障AI稳定运行和业务连续性 [9] - 需提升数据质量以增强模型可信度,在AI广泛应用背景下,数据来源更丰富、结构更复杂,数据倾斜、数据投毒等问题会加剧模型决策偏差,引发公众信任危机,需建立全生命周期模型评测和监控体系,加强算法公平性约束,提升模型稳定性和可解释性 [9] - 需避免模型共振以防范系统性风险,随着竞争加剧,市场主流大模型集中度会越来越高,商业银行依赖的模型算法逐步趋同,局部缺陷可能形成机构间模型共振并引发系统性风险,需加快构建更可靠知识体系,开展差异化模型训练,提升金融系统整体韧性 [9]
Meta再爆大瓜,气走杨立昆的Wang也受不了小扎了?
36氪· 2025-12-18 16:12
公司AI战略与重组 - 公司今年夏天开始投入重金打造“超级智能实验室”,并对内部AI团队进行多次重组,旨在加速AI发展 [1] - 经过半年四次重组,公司AI业务以“超级智能实验室”为核心,分为FAIR、MSL Infra基础设施、产品与应用、以及直接负责大语言模型的TBD Lab四个部门 [11] - TBD Lab是重组后的重中之重,由首席AI官Alexandr Wang直接领导,直接向首席执行官汇报,其现阶段核心目标是在明年一季度发布一个内部代号为“牛油果”的全新闭源AI模型 [1][2][11] 关键人物动态与管理挑战 - 公司以143亿美元收购数据标注公司Scale AI的49%股份,并聘请其28岁的创始人Alexandr Wang出任“首席AI官”,领导TBD Lab [2] - 包括Wang在内的多位关键高管对首席执行官的管理方式感到不满,Wang曾抱怨其微观管理令人窒息,而前GitHub负责人Nat Friedman也面临要求过快交付产品的巨大压力 [2][4] - 图灵奖得主、首席AI科学家杨立昆因需向Wang汇报以及路线分歧(反对闭源并质疑大语言模型路径),已于本月初官宣将于年底离职 [5][7] 人才与文化冲突 - 公司高薪从外部引进人才,但引发了与老员工的摩擦,有内部员工质疑Wang缺乏大公司管理经验且技术背景非顶级研究员,显得“德不配位” [7] - 高薪引进的人才留存也面临挑战,例如首席AI科学家赵晟佳曾考虑返回OpenAI,另有两位研究员在加入一个月内就离职返回OpenAI [7] - 公司正在抛弃早期强调“忠诚”的文化,激进引入外部管理者,导致“扎克伯格的朋友”等老派高层频频离职,如首席法律官和首席营收官近期相继离开 [8] 项目进展与财务压力 - 公司目前尚未拿出显著的AI成果,但正全力推进“牛油果”项目,计划使其在推出时达到Gemini 2.5的性能水平,并在夏季达到Gemini 3的水平 [1][11] - 公司2025年资本支出预计至少达700亿美元,远高于前一年的390亿美元,并已通过发行公司债券等方式筹资以支付数据中心和芯片成本 [12] - 公司宣布明年AI支出可能超过1000亿美元,但由于缺乏清晰的货币化路径,该消息导致股价下跌超过10%,市值蒸发超过2080亿美元 [12]
AI赛道竞争多维深化,生态应用格局加速演进
华金证券· 2025-12-12 16:18
报告行业投资评级 - 行业投资评级为“领先大市”,且评级为“维持” [4] 报告核心观点 - 核心观点认为AI赛道竞争正向多维度深化,生态应用格局正在加速演进 [2] - AI创作与推理应用已进入高速增长期,编程与角色扮演成为核心使用场景,中国开源模型崛起正带动多模态、端侧AI及智能体(Agent)等技术向产业化落地演进 [7] AI创作赛道市场表现 - 2025年11月,AI创作Web端产品总访问量超过2700万,总独立访客数超过770万 [7] - 头部产品优势明显,即梦AI和稿定AI的web端活跃用户超过百万 [7] - 部分产品增长迅猛,可灵AI的月活跃用户相比10月增长超50%,即梦AI新增下载量环比翻倍并重新突破千万,Canva可画、可灵AI等下载增速超100% [7] - 用户使用深度显著,多款产品平均使用时长达8分钟以上,其中Kuaizi平均访问时长近26分钟,度加创作工具达22.3分钟 [7] - 在AI视频生成细分赛道,共5款应用11月访问量超30万,包括即梦AI、可灵AI、Vidu AI等 [7] - APP端表现突出,美图秀秀平均日活跃用户近1800万,醒图、即梦AI分别超460万和超310万 [7] AI技术竞争与发展格局 - AI发展进入“大分流”阶段,竞争向多维度深化 [7] - 开源模型流量占比已达30%,成为特定场景的首要选择,其中中国开源模型占据全球开源模型流量近30% [7] - 推理优化模型主导,流量占比超50%,AI正从“生成文本”转向“思考问题” [7] - 主要使用场景为编程和角色扮演:编程类请求占比从2025年年初的11%飙升至50%以上;在开源领域,角色扮演占据开源模型流量的52% [7] - DeepSeek的流量中,超2/3为角色扮演和闲聊 [7] - 多模型生态格局逐渐清晰:闭源模型更多承担高价值、与收入强关联的工作负载;开源模型则更侧重于低成本、高并发的任务需求 [7] - 竞争已由单纯的技术竞赛转向关于场景适配、成本控制与生态构建的综合竞争 [7] AI应用扩展与技术趋势 - Agent(智能体)正在成为下一代AI范式,具备感知-规划-执行闭环能力,开发门槛因代码生成与框架支持而降低 [7] - 多模态融合逐步成熟,支持文本、图像、视频一体化生成,提升3D、视频等内容生产效率 [7] - 端侧AI生态快速发展,设备本地化部署兼顾低延迟与隐私保护 [7] - 整体趋势指向服务主动化、交互自然化与软硬件协同,推动AI从效率工具向智能伙伴演进 [7] - 中国正从AI领域的参与者向引领者转变:全球平台Hugging Face上,智源研究院和阿里巴巴的开源模型下载量分别达7.90亿次和7.49亿次 [7] - 应用层面,DeepSeek用户数已突破1亿,通义千问成为重要的开源基座模型 [7] 投资建议 - 建议关注蓝色光标、昆仑万维、天娱数科、因赛集团、视觉中国、汇量科技等公司 [7]
Meta上亿年薪的研究员们,却在偷师中国开源模型
观察者网· 2025-12-11 18:17
公司动态与战略调整 - Meta组建名为TBD Lab的新团队,其正在训练的“牛油果”(Avocado)模型使用了包括谷歌Gemma、OpenAI GPT-oss和阿里巴巴Qwen在内的多个第三方模型,该模型预计于明年春季首次亮相并可能作为闭源模型推出 [1] - 针对相关报道,Meta发言人回应称模型训练工作正按计划进行,时间表没有发生有意义的变更 [1] - 消息曝光后,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [1] - 因Llama 4表现不佳,Meta在最新一季度财报会上仅轻描淡写地提及Llama一次,该模型已不再是公司焦点 [5] - 扎克伯格随后对公司内部进行人事调整,拥有20年工龄的首席产品官Chris Cox在Llama 4翻车后被撤掉AI部门管理权限,部分Llama 4团队成员也被边缘化 [5] - 扎克伯格亲自挂帅开启AI“梦之队”招聘计划,从外部高薪挖来Scale AI创始人Alexandr Wang担任新的人工智能负责人,执掌全新的TBD实验室,并开出亿元薪酬大肆挖角同行 [5] - 公司更直接叫停了部分激进的元宇宙项目,以集中资源与OpenAI等竞争对手较量,对名为“牛油果”的新AI模型可谓孤注一掷 [6] - Alexandr Wang作为闭源模型的拥簇者,被认为是Meta新模型转向闭源的核心原因 [6] - 在Alexandr Wang领导下,Meta Superintelligence Lab在11月几乎毫无动作 [11] 行业竞争格局演变 - 过去两年,Meta通过开源Llama系列成功扮演了“反OpenAI联盟”的盟主,Llama一度被视为开源界的Linux,是全球开发者(包括中国开发者)的首选底座 [2] - 这一格局在2025年开始瓦解,随着年初DeepSeek开源模型的横空出世,以及后续阿里Qwen、月之暗面、智谱、Minimax等AI新势力纷纷发布高性能开源模型,Meta对开源生态的统治地位开始摇摇欲坠 [3] - 2025年4月,Meta发布的Llama 4性能未获开发者认可,且模型在LMArena的榜单排名被曝出存在“作弊嫌疑”,进一步饱受负面评价 [3] - 从性能角度看,无论是中国的“AI六小龙”还是阿里等互联网大厂,其最新的开源模型发布时均选择性能对标OpenAI、Google等头部闭源模型,Meta的Llama系列模型甚至已不配作为参照组来展示性能 [3] - 在下载和衍生模型数量上,阿里Qwen模型对Meta实现了赶超,2024年8月,千问的衍生模型数量第一次超过Llama,到了2025年10月,千问模型在全球下载量上也正式超过了Llama [4] - 这意味着Meta无论在数量还是质量上都失去了全球开源模型老大的地位 [4] - 华尔街投行KeyBanc资本市场的分析师在11月的报告中写道,在某种程度上,Meta的AI之路恰恰与Alphabet相反:年初被视为AI赢家,但现在投资回报和战略方向却成了最大的问号 [10] - 美国媒体CNBC在报道中表示,真正具有突破性的AI产品不会出现在小团队手中,而是出现在那些掌握完整生态体系的企业里 [10] - Meta今年成为了美国资本市场上最让人失望的AI股之一 [10] 市场反应与舆论评价 - 社交媒体上,网友们对Meta花上亿美元挖角的员工们选择使用Qwen开源模型进行了大量调侃,有网友直言“花了数十亿美元雇AI研究员,敢情就是为了抄作业?” [6][9] - 扎克伯格过去多次借鉴抖音、微信等中国产品功能,本次使用千问模型被视作一个巨大的“回旋镖” [10] - 扎克伯格在今年年初的播客中曾警告,如果不进行开源对抗,世界将被“反映中国价值观”的AI模型所主导,而他本人也多次在公开场合渲染“中国科技威胁论”,在国会听证会上曾是唯一一个对中国窃取技术问题表现出强硬攻击姿态的硅谷CEO [10] - Meta在打造下一代闭源模型时向Qwen“取经”,某种程度上宣告其亲自承认了Llama在开源领域的统治力已经被终结 [10] - 从开源盟主到闭源追随者,从“中国威胁论”到“偷师”中国同行,Meta的“牛油果”尚未发布就已经舆论缠身,这被视作是硅谷面对中国AI快速崛起时集体焦虑的一个缩影 [11]
Meta或转向闭源,小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:46
公司动态与战略 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 市场表现 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经资讯· 2025-12-11 09:17
公司动态 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型"Avocado"时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型"Avocado"预计将于明年春季首次亮相 [1] - "Avocado"模型可能作为"闭源"模型推出 [1] 市场反应 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:11
Meta新AI团队与模型进展 - Meta首席执行官扎克伯格组建了一个名为TBD Lab的新团队 [1] - 该团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 阿里巴巴市场表现 - 阿里巴巴美股收盘上涨1.83%,股价达到158.82美元 [2]