Llama系列
搜索文档
新加坡国家AI计划转向阿里千问,硅谷模型正在失去全球市场?
新浪科技· 2025-11-26 08:55
全球大模型市场正在迎来一个新的转折点。 据新加坡媒体报道,新加坡国家人工智能计划(AISG)近日发布了最新的东南亚多语言大模型Qwen- SEA-LION-v4。值得注意的是,该模型在核心技术底座的选择上进行了一次重大战略调整:没有选择此 前长期使用的美国开源大模型,转而采用阿里巴巴的通义千问(Qwen)开源模型。 这一举动被视为全球AI开源生态风向转变的缩影。从东南亚的国家级项目,到美国硅谷的科技巨头, 中国开源模型正在凭借"性能"与"成本"的双重优势,逐步侵蚀原本由美国公司主导的市场份额。 AISG的选择并非偶然,而是基于东南亚复杂的语言环境做出的务实考量。 长期以来,全球主流AI模型(如Meta的Llama系列)大多以英语为中心,在处理印尼语、泰语、缅甸语 等东南亚小语种时,往往面临"水土不服"的窘境。东南亚地区拥有超过1200种语言,且日常交流中普遍 存在多语言混用(语码转换)的情况,原有的西方模型架构难以有效弥合这一"AI鸿沟"。 此次发布的Qwen-SEA-LION-v4,正是基于阿里最新的Qwen3-32B构建。 通义千问正在成为全球多国构建自主AI生态的首选基础设施。 据日经新闻报道,通义千问 ...
新加坡国家AI计划:放弃Meta模型,转向阿里千问
21世纪经济报道· 2025-11-25 20:27
据悉,AISG于11月25日宣布推出的"Qwen-SEA-LION-v4"模型,在一项衡量东南亚语言能力的开源榜单 上迅速占据首位。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处 理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。 (来源:智通财经) (原标题:新加坡国家AI计划:放弃Meta模型,转向阿里千问) 据智通财经,新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言 大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在 全球影响力版图中的一次关键扩张。 ...
新加坡国家AI计划:转向阿里千问
财联社· 2025-11-25 17:15
新加坡国家人工智能计划战略调整 - 新加坡国家人工智能计划(AISG)进行重大战略调整,在其东南亚语言大模型项目中放弃Meta模型,转向阿里巴巴的通义千问Qwen开源架构 [1] - 这一转变标志着中国开源AI模型在全球影响力版图中的一次关键扩张 [1] 新模型性能与影响 - AISG于11月25日宣布推出的"Qwen-SEA-LION-v4"模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位 [1] - 新模型旨在解决长期痛点:此前以Meta的Llama系列为代表的开源模型在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能 [1]
杭州AI产业放大招,用“开源”建生态
经济观察网· 2025-11-24 19:29
据微信公众号"杭州发布"消息,11月22日,杭州举办AI开源生态大会,会上发布了杭州市人工智能场景 开放示范"两张清单"、人工智能开源政策包,本次大会及一揽子产业政策的发布,犹如一个明确信号 ——杭州要建设"AI开源之都"。 给钱,给场景 在软件和AI领域,所谓开源就是把程序的"源代码"完全公开。如果用做菜类比,"闭源"就是把菜品配方 保密,只卖成品菜,"开源"则是把菜品完整的用料、制作流程等公开在网络论坛上,任何人都可以拿来 即用,甚至自行改良,而这个公布菜品做法的网络论坛,就是"开源社区"。目前全球知名AI大模型中, 中国的DeepSeek、美国科技公司Meta的Llama系列都是开源大模型。 为了吸引开发者到杭州开发开源软件、大模型以及解决方案,杭州推出的市级产业扶持政策主要从两方 面入手,一是真金白银奖励开源开发者,二是让政府、国企带头用开源。 这些政策包括,鼓励软件企业面向操作系统、数据库、云计算、大数据、AI、区块链等领域发布基础 性、前瞻性的自主技术开源项目,对在开放原子开源基金会托管的孵化期开源项目,给予一次性100万 元奖励;每年安排一定额度智能券和算力券,支持魔搭社区(开源社区)面向开发者 ...
忍无可忍,LeCun离职,Meta市值应声蒸发1400亿
36氪· 2025-11-12 09:35
公司核心人事变动 - 首席AI科学家Yann LeCun计划从Meta离职,下一步打算创业 [1] - 该消息导致公司市值在盘前交易中蒸发1.5%,约200多亿美元(约1400多亿人民币),开盘后持续下跌 [2] 公司AI战略调整 - 公司正在调整AI战略以追赶谷歌和OpenAI,将战略性放弃由LeCun领导了十多年的基础人工智能研究实验室 [5] - 战略调整表现为AI部门在6个月内进行了4次重组,导致研究无法推进 [6] - 公司任命OpenAI前高级研究员赵晟佳为MSL超级智能实验室首席科学家,此举被视为对LeCun地位的降级 [8] - 公司AI部门重组后形成四个主要部分:TBD实验室(负责人Alexandr Wang)、产品与应用研究(负责人Nat Friedman)、基础设施(负责人Aparna Ramani)、基础人工智能研究FAIR(负责人Robert Fergus) [7] 内部权力结构与冲突 - LeCun在组织权力结构中的分量已与昔日有明显不同,需向28岁、高中学历的TBD实验室负责人Alexandr Wang汇报工作 [8] - Alexandr Wang要求FAIR发表研究成果前必须接受TBD实验室的额外审核,限制了LeCun团队的学术自由 [8] - 上个月,在Alexandr Wang主导下,FAIR的核心骨干田渊栋及其团队被成建制裁撤,该团队专攻的强化学习与规划是LeCun实现"世界模型"愿景的关键技术路径之一 [5][10] 技术路线分歧 - LeCun是著名的"LLM怀疑论者",认为大语言模型不理解物理世界,其创业公司将推进需要"十年"开发的"世界模型"架构 [11] - 公司CEO的战略是全部资源押注LLM,在产品层面快速追赶对手,这与LeCun的长期基础研究路线存在根本分歧 [11] - 与LeCun支持开源形成对比,由Alexandr Wang领导的TBD实验室正严肃讨论将未来Llama版本转为闭源模式 [11] 公司资源投入与战略决心 - 公司CEO在财报会议上明确表态目标是构建超级智能,并要"积极地提前建设能力" [12] - 公司将2025年资本支出预期提高到700亿至720亿美元,远超市场预期,以支持其AI战略 [12] - 公司不惜代价从竞争对手处挖人,为TBD实验室的天价挖角和GPU采购支付账单,导致不直接产出产品的FAIR成为资源再分配的牺牲品 [12] 历史背景与影响 - LeCun于2013年受CEO邀请加入公司,创建了拥有"大学式"特权和高独立性的FAIR实验室 [13] - 在LeCun领导下,FAIR的核心任务是发表高水平论文、推动基础科学并向全球开源成果,为公司赢得了在AI基础研究领域的崇高声望 [14][16] - LeCun的离开标志着公司以FAIR为代表的、长达十年的"学院派"研究黄金时代的结束 [16]
突发!忍无可忍,首席人工智能科学家离职!Meta市值应声蒸发1400亿
是说芯语· 2025-11-12 07:52
核心事件与市场反应 - 图灵奖得主、Meta首席AI科学家Yann LeCun计划离职,下一步打算创业[1][2] - 受此消息影响,Meta公司市值在盘前交易中蒸发1.5%,约200多亿美元(约1400多亿人民币),且开盘后持续下跌[4] Meta公司AI战略调整 - Meta公司AI战略频繁摇摆,6个月内对内部AI部门进行了4次重组[8] - 公司调整AI战略以追赶谷歌和OpenAI,将战略性放弃由LeCun领导了十多年的基础人工智能研究实验室[6] - 公司任命OpenAI前高级研究员赵晟佳为MSL超级智能实验室首席科学家,此举几乎等同于将LeCun从内部AI组织领导核心地位降级[12] - 由Alexandr Wang领导的TBD实验室权力上升,LeCun需向年仅28岁、仅有高中学历的Alexandr Wang汇报工作[12] - TBD实验室要求FAIR在发表研究成果前必须接受其额外审核,LeCun本人发表论文也需经其同意[13] 组织架构与人员变动 - FAIR实验室遭遇大裁员,包括科学家总监田渊栋及其团队在内的600多人被裁撤[6][16] - 田渊栋团队专攻的强化学习与规划是LeCun实现“世界模型”愿景的关键技术路径之一,其被裁对LeCun路线是重大打击[18] - Meta公司AI部门重组后主要架构为:TBD实验室(负责人Alexandr Wang,专注高风险创新与大模型开发)、产品与应用研究(负责人Nat Friedman,推动技术产品化)、基础设施(负责人Aparna Ramani,负责硬件与平台支持)、基础人工智能研究FAIR(负责人Robert Fergus,专注长期基础研究)[10] 核心路线分歧 - LeCun是著名的“LLM怀疑论者”,认为大语言模型只是文本数据库,不理解物理世界,其创业公司将推进其倡导的“世界模型”架构[19] - “世界模型”路线被LeCun承认是需要“十年”开发的长期架构,与扎克伯格追求在产品层面快速追赶对手的战略需求不符[20] - 理念上存在开源与闭源冲突,LeCun是AI开源运动旗帜人物,而TBD实验室已在内部严肃讨论将Llama未来版本转为闭源模式[21] 公司战略与资源投入 - 在OpenAI和谷歌压力下,公司选择激进狂奔的“快车道”战略,彻底抛弃“学院派”耐心[22] - 公司目标构建超级智能,并“积极地提前建设能力”,2025年资本支出预期提高到惊人的700亿至720亿美元,远超市场预期[22] - 公司不惜代价用高薪从竞争对手处挖人,为TBD Lab的投入支付巨额账单,不直接产出产品的FAIR实验室成为资源再分配的牺牲品[22] LeCun在Meta的历程与影响 - LeCun于2013年受扎克伯格邀请加入,一手创建FAIR实验室,该实验室被赋予“大学式”特权,拥有极高独立性,核心任务是发表高水平论文、推动基础科学并开源成果[23][24] - 2018年,LeCun与Hinton、Bengio共同获得图灵奖,标志着Meta在AI基础研究领域的声望达到顶峰[25] - LeCun的离开标志着Meta以FAIR为代表的、长达十年的“学院派”研究黄金时代的彻底结束[27]
独家揭秘Meta AI大裁员:Llama 4败于DeepSeek带来的恐慌
创业邦· 2025-10-27 18:11
Meta AI部门重组背景 - Meta对AI部门进行重组裁员约600人,使AI部门员工总数降至不到3000人[8] - 此次重组由新任首席AI官亚历山大·王主导,属于部门内部调整[8] - 裁员决定源于Llama 4表现明显落后于DeepSeek等中国竞争对手,给公司带来强烈危机感[5][18] 重组具体措施 - 裁员涉及超级智能实验室下三个部门:FAIR(基础AI研究部门)、产品应用部门和MSL Infra部门,只有TBD Lab未受影响且继续扩张[10] - TBD Lab是今年6月新组建的AI团队,由亚历山大·王亲自负责,专注于开发下一代基础模型[10] - 被裁员工离职日期为11月21日,按加州法规保留两个月合同与薪水[8] 人才战略调整 - 公司不惜重金从竞争对手挖来顶级AI人才,包括从OpenAI打包带走八名核心开发人才[11] - 挖来苹果AI大模型团队负责人庞若名,开出令人难以置信的两亿美元天价合同[11] - 新组建的TBD Lab平均薪酬水准比其他三个部门高出一大截[10] 领导层变动 - 今年6月扎克伯格引入Scale AI创始人亚历山大·王全权负责AI业务[13] - 公司向Scale AI投资148亿美元,获得后者没有投票权的半数股权[13] - 亚历山大·王被认为具备卓越的商业头脑和执行能力,更偏向商业思维和实际落地[15] Llama 4失败原因 - Llama 4表现令人大失所望,团队原本优先投入在多模态方向,但DeepSeek出现后推理能力显著超越Llama[18] - 团队两头都想做好但时间来不及,导致产品混乱[20] - 问题根源在于中高层决策问题,存在“外行管内行”的话语权错位[20] 基础研究部门影响 - FAIR部门遭受重创,该部门由AI界“三大教父”之一杨立昆创建[23][25] - 基础研究团队FAIR被并入超级智能实验室,传统发表论文的研究角色被能够推出产品的工程角色取代[25][26] - 知名华人AI研究员田渊栋也在裁员范围,他在强化学习和大语言模型领域享有很高声望[28] 行业反应 - AI行业竞争进入白热化,人才成为各家竞相争夺的最紧俏资产[7] - 田渊栋被裁后,OpenAI、xAI等热门AI创业公司同行纷纷表示这是Meta的重大失误并希望招募这些人才[29][31] - 行业同行认为Meta让田渊栋离开是重大错误,他无疑是世界上最优秀的AI科学家之一[31]
独家揭秘Meta AI大裁员:Llama 4败于DeepSeek带来的恐慌
新浪科技· 2025-10-27 09:01
公司AI部门重组与裁员 - Meta宣布对旗下人工智能部门进行重组,裁员约600名员工,裁员后AI部门员工总数降至不到3000人[6][8] - 此次裁员涉及超级智能实验室下属四个部门中的三个,只有模型训练与扩展部门TBD Lab未受影响且将继续扩张招聘[11][12] - 受影响的员工被告知11月21日为离职日期,按照加州法规被裁人员将保留两个月合同与薪水[9] 新任AI负责人与战略调整 - 公司于今年6月引入Scale AI创始人兼CEO亚历山大·王全权负责AI业务,此举旨在加强AI模型训练数据和基础设施方面的核心能力[18][20] - 新任负责人认为AI部门存在臃肿低效问题,希望通过裁员实现更加精简灵活的团队结构[7][20] - 战略重心转向加速模型与产品开发以获得即时回报,传统基础研究角色正被能够推出产品的工程角色所取代[29] Llama模型表现与竞争压力 - 今年4月发布的Llama 4模型表现令人失望,其开源大模型明显落后于DeepSeek等中国竞争对手[2][22] - 团队内部因DeepSeek推理能力超越而出现恐慌,产品开发方向出现混乱[22][24] - 管理层认为Llama 4失败与团队领导问题有关,促使公司从外部引入新的领导力来提升竞争力[24] 人才流动与团队结构变化 - 新组建的TBD Lab部门集结了行业顶级技术人才,包括从OpenAI打包挖走的8名核心开发人才以及苹果AI大模型团队负责人[14] - 新团队成员平均薪酬水准显著高于其他三个部门,内部出现薪资落差和士气影响[14][25] - 基础AI研究部门FAIR被并入超级智能实验室,其创始人杨立昆的位置逐渐边缘化[26][28] 关键人员变动与行业影响 - FAIR研究总监、知名华人AI研究员田渊栋在裁员范围内,其在强化学习和大语言模型领域享有很高声望[31][33] - 田渊栋团队曾开发早于AlphaGo的围棋AI DarkForestGo,并发现注意力汇聚现象等重要研究成果[33] - 行业同行对Meta裁员决策表示遗憾,OpenAI、xAI等公司积极争取被裁的资深研究人员[34]
独家揭秘Meta AI大裁员:Llama 4落后DeepSeek的恐慌|硅谷观察
新浪科技· 2025-10-27 07:23
公司战略重组 - Meta对人工智能部门进行重组,裁员约600名员工,使AI部门员工总数降至不到3000人 [3] - 新任首席AI官亚历山大·王主导此次重组,旨在通过缩减团队规模提升决策效率和员工影响力 [3] - 重组背后原因是旗舰开源模型Llama 4表现令人失望,显著落后于DeepSeek等中国竞争对手,引发公司内部危机感 [1][10] 部门调整重点 - 超级智能实验室旗下四个部门中,TBD Lab(模型训练与扩展部门)未受裁员影响且将继续扩张招聘 [5] - FAIR(基础AI研究部门)、产品应用部门和MSL Infra(基础设施部门)三个部门受到裁员影响 [5] - TBD Lab是今年6月新组建的团队,由亚历山大·王亲自负责,专注于开发下一代基础模型和实现“超级智能” [5] 人才战略转变 - 公司不惜重金从谷歌、OpenAI、苹果等竞争对手挖来顶级AI人才,包括一次性从OpenAI打包带走八名核心开发人才 [6] - 为苹果AI大模型团队负责人庞若名开出了令人难以置信的两亿美元天价合同 [6] - 基础研究部门FAIR的创建者、AI界“三大教父”之一杨立昆的位置逐渐边缘化 [14] - FAIR团队的研究总监、知名华人AI研究员田渊栋也在裁员范围内 [18] 领导层变更 - 今年6月扎克伯格引入Scale AI创始人兼CEO亚历山大·王全权负责AI业务 [7] - 公司向Scale AI投资148亿美元,获得后者没有投票权的半数股权,Scale AI估值达到300亿美元 [7][9] - 亚历山大·王的个人资产达到45亿美元,他对AI模型训练数据和基础设施有深刻理解 [9][10] 业务方向调整 - 公司AI优先事项从基础研究转向加速开发模型与产品,追求即时回报 [17] - FAIR团队的职责发生变化,更多研究想法将被整合到TBD Lab的产品项目中 [17] - 传统的发表论文的研究角色正被能够推出产品的工程角色所取代 [17] 行业影响 - 裁员消息公布后,OpenAI、xAI等热门AI创业公司立即在社交媒体上向被裁员工伸出橄榄枝 [19][21] - 业内同行认为Meta让田渊栋等顶级研究人员离开是重大错误 [19][21] - 田渊栋在X上的发文立即成为在线招聘会,多家公司希望招募其被裁同事 [21]
当着白宫AI主管的面,硅谷百亿投资人“倒戈”中国模型
环球时报· 2025-10-15 11:24
行业格局转变 - 全球AI行业格局正从美国主导的不计成本追求极限参数的上半场,转向由性价比、商业效率和生态价值主导的新阶段[3] - 中国AI的地位从过去的追赶者提升为与美国并驾齐驱的竞争者,两者形成两种价值机制在同一舞台上并行的比拼[5][7] - 制胜关键不再仅体现为参数更多、模型更大,更在于能以更低的成本、更快的速度稳定服务用户[7] 中国AI模型表现 - 以DeepSeek、Kimi和Qwen为代表的中国开源模型矩阵,在多项关键性能指标上实现了对Meta的Llama系列的全面反超[5] - Kimi K2版本K2-0905在全球知名AI编程评测平台Roo Code上获得超过94%的评分,成为首个在该平台突破90%评分的开源模型[4] - Kimi K2在全球公认的LMSys Chatbot Arena上登顶开源第一,被誉为全网领先的开源文本模型[7] - DeepSeek在复杂的推理任务上超越了OpenAI的o1-preview版本,并成功将高端技术推向商业场景[7] 市场应用与生态突破 - 中国模型在Anthropic限制API服务后迅速填补市场空白,在高价值领域抢占用户市场[3][4] - 硅谷知名投资人查马斯将其公司的大量工作需求从亚马逊旗下AI平台转向中国模型Kimi K2,理由是性能强且比OpenAI和Anthropic便宜太多[1][3] - Cursor、Perplexity、Vercel等全球知名开发平台及应用相继宣布接入中国模型[4] - 中国在开源能力、成本效率与生态落地上实现弯道超车,展现出巨大的市场应用潜力[4][7]