Workflow
Llama 5
icon
搜索文档
开源模型TOP5,被中国厂商包圆了
量子位· 2025-10-15 14:27
中国开源大模型行业地位转变 - 中国开源大模型已占据全球榜单前五名,从追赶者转变为引领潮流的一方[1][6] - 阿里Qwen系列和DeepSeek自2024年下半年起在开源社区影响力持续扩大[1] - 行业普遍认为中国开源力量已对大模型格局产生冲击,重要节点是"DeepSeek时刻"[23] 文本能力表现 - 在LMArena文本排行榜中,智谱GLM-4.6和DeepSeek-v3.2紧随顶级闭源模型之后[7] - 阿里Qwen3-max-preview跻身文本排行榜TOP3,但该版本未开源[8] - 文本排行榜总投票数达4,222,042次,涵盖255个模型[9] 编程能力表现 - 前端开发排行榜中,国产开源模型与编程SOTA Claude分庭抗礼[10] - DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder均进入前10名[10] - 前端开发排行榜总投票数为187,703次,涵盖49个模型[11] 多模态能力表现 - 视觉方面,腾讯Hunyuan-vision-1.5和Qwen3紧跟闭源SOTA,位列开源最强[12] - 视觉排行榜总投票数达532,681次,涵盖79个模型[13] - 视频模型领域,阿里Wan-v2.2在开源模型中表现最佳[13] - 国产闭源视频模型Kling-2.5、Seedance-v1-pro、Hailuo-02等位居榜单前列[14] 社区影响力与下载量 - 趋势榜中,蚂蚁Ling-1T和智谱GLM-4.6是最受关注的开源模型[16] - DeepSeek-R1是最受欢迎模型[17] - Qwen3是下载量最高的模型之一,在百亿参数级别领先包括gpt-oss在内的其他开源模型[18] - Qwen/Qwen3-0.6B模型下载量达6.86M,Qwen/Qwen3-32B下载量达6.24M[19] 全球竞争格局变化 - 开源模型领域主导地位转变可能重新定义全球创新格局[21] - Meta的Llama 4翻车为中国开源模型崛起提供了机会[24] - Meta以35亿美元offer挖走OpenAI前CTO公司联创Andrew Tulloch,引发对Llama 5的期待[25][26]
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
虎嗅· 2025-10-03 12:53
Meta内部混战又有新剧情了,这次主角是FAIR实验室。 据The Information报道,两位知情人士透露,Meta最近对FAIR实验室施加了一项新政策:所有研究成果 在公开发表前,必须通过额外的内部审查。 这项政策在FAIR内部引起了轩然大波。多位员工认为,这一变化严重限制了他们此前享有的学术自 由,即在Meta之外自由分享研究成果的权利。 长久以来,开放的研究氛围一直是FAIR吸引顶尖人才的基石。然而,随着Meta全面重塑其AI业务,公 司开始要求FAIR更多地为内部产品服务,同时减少可能助益竞争对手的外部研究分享。 这些变化让FAIR的联合创始人Yann LeCun深感困扰。据知情人士称,他甚至在九月份私下向同事透 露,或许应该辞去首席科学家的职位。 LeCun的不满早有征兆,几个月来,他对公司新成立的、统管所有AI业务的Meta超级智能实验室 (MSL)的内部状况已日益失望。 今年7月,MSL任命了来自OpenAI的研究员赵晟佳担任首席科学家。一位知情人士称,LeCun对于外 界"他已被降职"的看法感到十分恼火。尽管Meta最终允许LeCun继续专注于自己的研究并自由发表,但 紧张气氛已然形成。 ...
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
机器之心· 2025-10-03 11:39
Meta AI业务重组与内部冲突 - Meta对FAIR实验室实施新政策,要求所有研究成果在公开发表前必须通过额外的内部审查[2] - 该政策限制了研究人员的学术自由,引发FAIR内部强烈反对,多位员工认为这破坏了吸引顶尖人才的开放研究氛围[5] - FAIR联合创始人Yann LeCun对此深感困扰,曾在9月份私下考虑辞去首席科学家职位[6] 新领导层与组织架构调整 - Meta于6月聘请前Scale AI首席执行官Alexandr Wang和前GitHub首席执行官Nat Friedman共同领导新成立的超级智能实验室(MSL)[11] - 为聘请Wang,Meta与Scale达成价值143亿美元的交易,并授予Wang本人价值超过2亿美元的股票[12] - 8月该部门被重组为四个小组:TBD Lab(开发Llama 5)、产品与应用研究团队、基础设施团队和FAIR[18] 内部文化冲突与人才管理问题 - 新成立的超级智能实验室导致"新旧两派"紧张关系,元老级研究员对新部门的保密文化及新同事的天价薪酬感到不满[8] - TBD Lab要求研究员每周五天现场办公,而Meta其他AI研究员通常只需每周到岗三天,引发混合办公员工反感[15] - 人事动荡持续,例如Alexandr Wang的幕僚长Bill Long于6月加入Meta但现已返回Scale[16] 产品整合与内部阻力 - Meta AI聊天机器人应用从首席产品官Chris Cox团队划归超级智能实验室管理[15] - 该应用在9月准备增加AI生成的短视频信息流(Vibes)时,遭到Reality Labs可穿戴设备团队成员的公开反对[15] - TBD Lab虽为明星项目,但一些被邀请的研究员拒绝了offer,部分原因是高压工作氛围和薪酬差距[15] 领导层回应与整合挑战 - Meta发言人声明"研究是MSL主要支柱之一,没有限制研究人员发表论文",并强调LeCun作为FAIR首席科学家的角色没有改变[13] - Nat Friedman在8月会议上表示希望赋予技术成员更多权力,减少繁文缛节和内部会议频率[16] - 新组织仍处于早期整合阶段,面临理顺内部文化的巨大挑战,前研究员将之前Gen AI部门文化描述为"抢占地盘、狙击项目、窃取成果"[13]
143亿美金,扎克伯格砸出一地鸡毛
36氪· 2025-09-02 17:49
公司战略与投资 - Meta斥资143亿美元(约1000亿元人民币)收购Scale AI并高薪挖角AI顶尖人才[4] - 公司同时收购语音AI初创公司Play AI和WaveForms AI并与Midjourney在文生图领域达成合作[39] - 在美国多地建设大型数据中心包括造价500亿美元的路易斯安那州Hyperion超大数据中心[40][41] 组织架构调整 - 公司重组AI部门成立超级智能实验室(MSL)下设TBD Lab、FAIR、PAR和MSL Infra四个子机构[48] - TBD Lab由Alexandr Wang领导负责下一代Llama研发FAIR由Yann LeCun负责但需向Alexandr Wang汇报[52][53][54] - 原有AGI基础小组解散AI产品小组负责人转至Threads项目[49][50] 人才流动与薪酬问题 - 新员工年薪包达数百万美元而老员工年薪普遍仅数十万美元导致严重薪资倒挂[61] - 前OpenAI研究员赵晟佳入职数日后获"首席AI科学家"头衔留任[71][72][73] - 多名高端人才短期离职包括前OpenAI研究员Ethan Knight、Avi Verma和谷歌DeepMind的Rishabh Agarwal[78] 合作与数据质量争议 - Scale AI数据质量被内部研究人员质疑Meta转向与竞争对手Mercor和Surge合作[14][17][21] - Scale AI依赖众包模式导致数据质量不足而Surge与Mercor采用高薪专业人才模式[17][20] - OpenAI和谷歌宣布停止与Scale AI合作后者裁员200名数据标注员工[24][25] 内部管理问题 - 新老员工均对资源分配不满新员工未获得承诺资源老员工被边缘化[59][63] - Alexandr Wang被指管理方式傲慢与扎克伯格多次冲突加剧团队矛盾[78] - MSL办公区需两层安保和特殊权限工牌体现资源高度集中[60] 研发进展与挑战 - MSL已着手研发下一代AI模型Llama 5但成效仍待观察[79][80] - 公司被曝在内部编程工具中使用Anthropic和OpenAI模型[7]
小扎砸了143亿的Scale AI,已与Meta“闹掰”?曝挖来的高管2个月就走人,数据质量也遭嫌弃
36氪· 2025-09-02 07:31
高管变动与整合问题 - Scale AI前高管Ruben Mayer加入Meta不到两个月即离职 曾担任生成式AI产品与运营高级副总裁[1][3] - Mayer本人声称离职属个人原因 并强调自己从第一天就是TBD Labs核心部门成员[3] - 部分被Alexandr Wang带来的高管未进入TBD Labs核心研发团队[5][6] 数据合作与质量争议 - Meta在模型训练中继续使用Scale AI竞争对手Surge和Mercor的数据标注服务[4] - 多名Meta研究人员直言Scale AI数据质量不佳[4] - 公司发言人坚称Scale AI数据不存在质量问题[4] 行业竞争格局变化 - OpenAI和谷歌在Meta投资后宣布停止使用Scale AI服务[4] - Scale AI随后裁减200名数据标注员工 归因于市场需求变化[4] - AI实验室行业惯例为同时与多个数据标注厂商合作[4] 人才流失与团队动荡 - 来自OpenAI和Scale AI的新研究员对Meta繁琐流程不满 部分已闪电离职[5] - Meta原有GenAI团队被边缘化 多名老员工选择离职[5] - MSL新老团队存在摩擦 顶尖人才招得来却留不住[5] 战略方向与合作伙伴关系 - 内部高层讨论整合谷歌Gemini或OpenAI模型至Meta应用[7] - 部分内部工具已整合Anthropic模型 如代码助手调用Claude进行编程[7] - 公司声称采取全面策略:自建模型 与外部合作 坚持开源并行[7] 投资规模与市场反应 - Meta对Scale AI投资金额达143亿美元[1][4] - 外界质疑巨额人才投入(数百万美元年薪)可能仅用于调用外部API[7] - 专业人士认为外部合作属权宜之计 最终目标为推动Llama 5与竞争对手抗衡[7]
143亿美金买来一场空,小扎向谷歌OpenAI低头,史上最大AI赌注失速
36氪· 2025-09-01 14:26
核心观点 - Meta因Llama 4性能评测造假丑闻声誉受损 随后以143亿美元收购Scale AI并高薪挖角AI人才 但引发管理混乱、团队内讧及人才流失问题 同时与Scale AI的合作关系出现裂缝[1][3][15] 战略投资与收购 - 公司斥资143亿美元(约1000亿元)收购Scale AI 旨在强化AI领域布局[1][11] - 同时收购语音AI初创公司Play AI和WaveForms AI 并与图像生成公司Midjourney达成合作[2][19] - 在美国多地建设大型数据中心 包括造价500亿美元的路易斯安那州Hyperion超大数据中心[19] 人才流动与组织架构 - 通过九位数年薪(上亿美元)挖角OpenAI、谷歌DeepMind、Anthropic等公司的顶尖研究员[17][18] - 重组AI部门成立超级智能实验室(MSL) 下设4个子机构:TBD Lab(由Alexandr Wang领导)、FAIR(Yann LeCun负责)、PAR(Nat Friedman领导)、MSL Infra[25][26][28] - 但出现大规模人才流失:前OpenAI研究员Ethan Knight、Avi Verma及谷歌DeepMind的Rishabh Agarwal仅在岗数月便离职 老员工也因资源分配不公大量出走[31][34][35] 管理问题与内部矛盾 - 薪资差距悬殊:老员工年包约数十万美元 新员工可达上亿美元 导致严重不满[28][29] - 资源分配向MSL倾斜 老部门员工被边缘化 计算资源遭挤压[28] - Alexandr Wang被指管理方式傲慢 与扎克伯格多次冲突 且其缺乏AI研究背景引发质疑[21][35] 合作关系变化 - 与Scale AI合作出现裂缝:TBD Lab转而与竞争对手Mercor和Surge合作 此前对Scale AI的数十亿美元投入效果存疑[3][6][9] - Scale AI数据质量被内部评价为"差到不能用" 因其依赖众包模式 而竞争对手采用高薪专业人才模式[7][9] - OpenAI和谷歌已停止与Scale AI合作 后者于7月裁员200名数据标注员工[9] 运营动态 - 前Scale AI高管Ruben Mayer仅在Meta任职两个月即离职[4] - 公司内部使用竞争对手模型:在编程工具中采用Anthropic和OpenAI模型 文生图领域与Midjourney合作[2] - 为留住人才采取紧急措施 如为前OpenAI研究员赵晟佳(Shengjia Zhao)授予"首席AI科学家"头衔[32]
腾讯研究院AI速递 20250901
腾讯研究院· 2025-09-01 00:02
生成式AI行业动态 - xAI正式发布编码模型Grok Code Fast 1 该模型从零打造 速度比GPT-5快五倍 性价比高 性能进入全球编码模型前五名[1] - 模型架构聚焦真实编程任务 支持多语言 具备全栈开发与bug修复能力 研发团队以华人学者为主 通过用户反馈迭代优化 并公布多模态与视频生成路线图[1] - Meta因内部旗舰模型进展缓慢 Llama 5尚未成型 正寻求与OpenAI或谷歌合作为旗下应用注入AI 已在内部工具接入外部模型[2] - OpenAI发布语音模型GPT-realtime 具备超自然语音生成 情感语调模仿与多模态理解 准确率与推理能力显著提升 支持指令遵循 函数调用 异步对话与图像输入[3] - Realtime API同步上线 扩展SIP连接 复用提示 内置安全防护 以更低价格开放 推动语音AI智能体落地[3] - Claude更新隐私政策 默认允许收集用户对话与编程数据用于模型训练 不同意则仅保留30天 涵盖免费及付费用户[4] - 美团开源龙猫大模型LongCat-Flash 采用5600亿参数MoE架构 创新引入零计算专家和ScMoE 大幅提升效率与速度[5] - 模型在MMLU ArenaHard CEval等基准表现接近或超越DeepSeek V3.1与Qwen3 指令遵循与Agent任务排名领先 支持128k上下文 推理速度超100TPS 成本仅0.7美元/百万词元[5] - 全球七大LLM参加狼人杀210场对战 GPT-5以96.7%胜率领先 展现超强社交推理与操纵能力[6] - 作为狼人时以逻辑框架与心理战精准瓦解对手 作为村民时靠司法化调查体系抵抗操纵 零误伤关键角色[7] - xAI创始工程师李雪辰套现约700万美元股票后 被指窃取Grok核心代码库并叛逃至OpenAI xAI已提起诉讼指控盗取数十亿美元级别商业机密[8] 前沿科技研究进展 - 清华姚班本科生提出分层规划+强化学习框架 让宇树G1机器人在0.42秒内反应击球 连续对拉达106拍[9] - 高层规划器预测乒乓球轨迹与击球时机 低层RL控制器生成协调动作 融入人类动作参考提升击球自然性 实验中击球率96.2% 回球率92.3%[9] AI硬件投资视角 - a16z合伙人指出AI被局限在网页文本框 需通过硬件实现更自然交互 硬件优势在于被动收集语境信息让AI更精准有价值[10] - 关键突破点在于形态因子社会可接受 功能compelling 场景明确 成功路径是找到精确 有价值 社会认可的应用场景[10]
Meta超级智能实验室权力架构曝光:汪韬直接领导30名顶尖研究员
36氪· 2025-07-18 17:58
Meta超级智能实验室成立与高管变动 - Meta近期从OpenAI、谷歌和xAI等竞争对手处挖角顶尖人才,成立超级智能实验室,由前Scale AI首席执行官汪韬和前GitHub首席执行官奈特·弗里德曼领导,团队规模约3400人[3][5] - 汪韬被任命为Meta首席人工智能官,弗里德曼担任Meta副总裁,负责AI产品与应用研究,两人共同领导包括AGI Foundations、AI助手产品团队、基础AI研究实验室等在内的多个团队[5][7] - 实验室安保措施严格,需通过双重检查并持有特殊权限门禁卡才能进入,突显项目机密性质[3] 人才招募与组织架构 - Meta通过高薪挖角竞争对手研究员,薪酬包达到NBA球星级别,近期招募了来自OpenAI、Google DeepMind和xAI的多名顶尖研究员[7][8] - 约30名员工直接向汪韬汇报,这些下属几乎全部是从竞争对手实验室挖来的顶级研究员,包括七位此前未公开身份的员工[7] - 公司投入巨额资金吸引人才,包括投资Scale AI 143亿美元聘用汪韬,并计划以超十亿美元收购弗里德曼和丹尼尔·格罗斯的风险投资基金股权[7] Llama模型研发与战略调整 - Llama 4表现不佳,Meta计划改进架构与数据训练策略,部分工作已外包给其他公司[10] - 公司新建Llama 5研究实验室,许多老员工争相加入,未被选中者需继续改进Llama 4版本[9] - 汪韬等高管建议改变模型发布战略,考虑不再将最先进模型开源,以集中精力开发超级智能和自有产品[11] 资源投入与竞争优势 - Meta计划在计算资源上投资数千亿美元,以支持超级智能研发,算力资源成为吸引顶尖人才的关键优势[8][12] - 公司向潜在员工强调未来超级智能将带来更多空闲时间,Meta可提供娱乐服务,以此作为招聘策略的一部分[11] - 扎克伯格表示算力资源不仅用于工作,更是吸引最优秀人才的重要手段[12] 行业动态与竞争格局 - Meta的超级智能实验室是近年来最大战略赌注,旨在扭转AI领域困境并实现扎克伯格的"超级智能"愿景[7] - 公司面临将大量新招聘研究人员融入现有团队的挑战,需确保新老员工协同工作[9] - 开源模型策略存在争议,部分高管认为闭源模型有助于集中开发超级智能,但公司发言人表示将继续发布领先的开源模型[11]
Meta全新AI组织架构曝光,这范儿有点字节
量子位· 2025-07-18 14:16
Meta的AI组织架构调整 - Meta内部整合出3400多人的新AI组织,由首席人工智能官Alexandr Wang领导,副手为前GitHub CEO Nat Friedman分管AI产品和应用[2][17][20] - 新架构分为4个团队:AGI基础研究团队(含高薪挖来的顶尖人才)、AI产品团队(主打Meta AI助手)、基础AI实验室(由Yann LeCun带队)、Llama 5研发小团队[5][12][19][23] - 原Llama团队面临重组,可能采用双轨制:闭源最先进模型(Llama 5)与开源次先进模型(Llama 4 1)[7][25] 人才招募策略 - 通过上亿美元薪酬包从OpenAI、苹果、谷歌等公司挖角30余名顶尖AI人才,组成"超级智能实验室"[10][12][14] - 实验室成员包括Scale AI创始人Alexandr Wang、前GitHub CEO Nat Friedman、DeepMind Gemini核心开发者Jack Rae等[12][16] - 出现"人挖人"现象,如苹果前AI负责人庞若鸣的同事Tom Gunter和Mark Lee相继加入Meta[29][30][32][33] 与字节跳动AI架构的对比 - Meta新架构被指模仿字节跳动的AI组织模式,尤其是AGI团队Seed的结构[37][38] - 字节Seed由吴永辉领导,采用扁平化管理,其多模态方向已由周畅接手,技术落地成果显著(如豆包大模型)[36][38][39][42][44] - 两家公司均采用三层架构:AGI前沿研究+基础技术分支+产品工程团队[46][47][48] 行业竞争动态 - Meta的激进挖角策略引发OpenAI人才流失,ChatGPT发布会中出现的华人研究者被调侃为Meta潜在招募目标[51][54] - OpenAI CEO奥特曼曾警告Meta的高薪挖角可能破坏公司文化,内部已出现老员工对新晋高薪人才的抵触[27] - 行业共识显示,头部公司需同时布局AGI研究、基础技术分支和产品化能力以保持竞争力[45][48]
又一笔超1000倍回报的投资诞生了
投中网· 2025-06-25 15:23
核心观点 - Meta将以148亿美元收购Scale AI 49%股权 交易完成后Scale AI估值将飙升至290亿美元 较去年融资后估值138亿美元实现翻倍 [5][3] - 该交易将成为Meta继190亿美元收购WhatsApp后的第二大交易 反映出Meta在AI领域的战略布局 [5] - Scale AI作为AI数据标注领域的头部企业 客户涵盖谷歌 微软 OpenAI等科技巨头及美国国防部等政府机构 [5][11] - 创始人Alexandr Wang作为华裔天才创业者 28岁身价已达20亿美元 交易后其财富将进一步增长 [7][12][13] - 早期投资人Y Combinator种子轮投资12万美元 预计获得超1000倍回报 [6][22] 公司概况 Scale AI业务发展 - 创立于2016年 专注于AI训练数据标注服务 最初服务于自动驾驶领域 客户包括特斯拉 Cruise等 [10] - 业务版图持续扩张 转型为企业级数据集成商 协助客户进行AI开发和部署 [10] - 2023年实现年化收入7.5亿美元 同比增长三倍 成为收入最高的AI创企之一 [12] - 最新一轮融资发生在2024年5月 获得10亿美元融资 估值138亿美元 [24] 创始人背景 - 创始人Alexandr Wang成长于华裔科学家家庭 17岁进入麻省理工 后辍学创业 [8][9] - 创业动机源于发现AI行业缺乏高质量训练数据的瓶颈 [9] - 2023年入选《时代》全球百大AI人物 2025年以20亿美元身价成为全球最年轻亿万富豪之一 [12] 行业动态 AI数据标注行业 - 数据标注被视为AI行业的"脏活累活" 但作为深度学习算法的"燃料"不可或缺 [10] - 彼得·泰尔评价Scale AI提供的是AI/ML行业的基础设施 具有长期价值 [10] - 当前美国科技并购市场持续升温 AI项目获得高溢价收购 早期投资人回报丰厚 [6] Meta的AI战略 - Meta在AI领域先发优势逐渐丧失 Llama 4发布表现不及预期 [16] - 扎克伯格组建50人AI专家团队 致力于实现通用人工智能(AGI) [16] - 收购Scale AI有望将训练数据污染率从15%降至2% 缩短下一代模型训练周期40% [17] 投资回报 - Y Combinator种子轮投资12万美元 预计回报超1000倍 [6][22] - Accel通过多轮投资 预计获得超25亿美元退出收益 [22] - Outlander VC早期投资24.5万美元(估值300万美元) 预计回报数百倍 [22] - 2024年5月融资投资者(估值138亿美元)仍有望获得超额收益 [25]