Workflow
Llama 5
icon
搜索文档
90后华人科学家:超一亿美金年薪背后的权力游戏
首席商业评论· 2025-11-30 12:48
文章核心观点 - Meta AI战略路线发生根本性转变,从以FAIR实验室为代表的学院派长期理想主义,全面转向以产品化与商业落地为导向的实用主义 [4] - 图灵奖得主杨立昆的离职与年轻科学家赵晟佳的空降上位,标志着Meta内部新旧势力的权力更迭和AI技术路线的深层博弈 [4][16] - 硅谷AI人才争夺白热化,顶尖人才的流向正在重塑科技巨头间的权力天平 [5][12] 关键人物背景与影响 - 赵晟佳拥有顶尖学术背景:清华大学计算机系学士,斯坦福大学计算机科学博士,博士期间代表作引用量超23000次,并获得多项顶尖奖项 [8] - 赵晟佳是OpenAI核心技术骨干:作为早期核心开发者参与了ChatGPT、GPT-4、GPT-4.1的研发,并主导了具有技术核爆效应的“o1”与“o3”系列推理模型,构建了新型扩展范式 [10] - Meta为争取赵晟佳开出超一亿美金年薪的薪酬方案,并授予其“Meta超级智能实验室首席科学家”头衔,使其成为公司AI版图中仅次于扎克伯格和Alexandr Wang的第三号关键人物 [12][14] Meta的战略调整与内部动荡 - Meta斥资143亿美元收购数据标注巨头Scale AI,并成立“Meta超级智能实验室”(MSL),向AGI发起全面冲刺 [12] - MSL的成立导致原FAIR实验室被边缘化并入新体系,资源全面向产品化导向的MSL倾斜,引发内部资深科学家的不满 [16][17] - 赵晟佳入职Meta后曾遭遇管理混乱和文化冲突,一度决定离职,经扎克伯格亲自介入并赋予更大权力后才选择留下,但同期加盟的其他顶尖人才(如两位前OpenAI研究员)相继离职 [13][14][16] 行业影响与未来展望 - Meta内部权力重组和管理层“低龄化”(如28岁的Alexandr Wang统管AI全局)反映了行业在AGI征程上更加激进的投资逻辑 [16] - 赵晟佳团队将获得计划于2026年建成的“普罗米修斯”计算集群支持,该集群拥有1000兆瓦电力供应,将支撑超大规模AI训练,预示新的AI竞赛开始 [13][18] - Meta已暂停MSL除关键岗位外的所有招聘,以期更审慎地规划未来战略,反映出公司在激进扩张后尝试进行调整 [18]
2026 年,大模型未知的「能力拐点」能否实现可持续的业务增长?
机器之心· 2025-11-29 10:30
独立工作8小时,2026年AI能力可以成为真实的业务增长 - 有预测认为2026年中期AI模型将能够自主工作一整天(8小时),并在年底前达到多个行业中人类专家的水平[3] - 当前评估显示Anthropic的Sonnet 3.7模型能以50%的成功率完成长达一小时的任务[3] - 社区对预测方法存在质疑,认为其通过混合不同任务类别才呈现出指数趋势,且“成功完成任务”的定义可能过于宽松,对复杂工作流的代表性有限[3] - OpenAI内部预计到2026年收入增速可能降至个位数(约5–10%),公司强调需进入“战时状态”并聚焦“超级智能”研究[4] - Anthropic收入结构高度依赖企业客户和API,弱化了对大规模C端业务的依赖,有评论认为其可能在2025–2026年期间在ARR指标上超越OpenAI[4] - 社区评论认为Google的Gemini在C端助手体验和稳定性上的口碑不如ChatGPT,尤其在家庭设备、语音交互等场景[5] - 社区对Meta的Llama 5发布存在讨论,认为其可能调整开源授权策略,不再延续高开放度,这将直接影响2026年的开源生态[5] 从OpenAI、Anthropic到阿里字节,2026年头部玩家的AI战略路线有何同异 - 中美头部AI公司将2026年业务增长寄希望于AI技术的成熟和商业化应用,内部乐观增长预期正影响市场预期[7] - 对于阿里,有观点认为其可利用AI将所有子业务串成整体生态形成优势,也有观点认为其基因更偏向ToB,应重点面向政府、企业级AI项目,类似“国内版Anthropic”[6] - 对于字节,有观点提出“AI搜索终局可能不在硅谷,在字节”,其火山引擎的大模型服务调用量已占据国内公有云的46.4%,搜推能力在ToB市场可能对传统云厂商形成“降维打击”[6]
开源模型TOP5,被中国厂商包圆了
量子位· 2025-10-15 14:27
中国开源大模型行业地位转变 - 中国开源大模型已占据全球榜单前五名,从追赶者转变为引领潮流的一方[1][6] - 阿里Qwen系列和DeepSeek自2024年下半年起在开源社区影响力持续扩大[1] - 行业普遍认为中国开源力量已对大模型格局产生冲击,重要节点是"DeepSeek时刻"[23] 文本能力表现 - 在LMArena文本排行榜中,智谱GLM-4.6和DeepSeek-v3.2紧随顶级闭源模型之后[7] - 阿里Qwen3-max-preview跻身文本排行榜TOP3,但该版本未开源[8] - 文本排行榜总投票数达4,222,042次,涵盖255个模型[9] 编程能力表现 - 前端开发排行榜中,国产开源模型与编程SOTA Claude分庭抗礼[10] - DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder均进入前10名[10] - 前端开发排行榜总投票数为187,703次,涵盖49个模型[11] 多模态能力表现 - 视觉方面,腾讯Hunyuan-vision-1.5和Qwen3紧跟闭源SOTA,位列开源最强[12] - 视觉排行榜总投票数达532,681次,涵盖79个模型[13] - 视频模型领域,阿里Wan-v2.2在开源模型中表现最佳[13] - 国产闭源视频模型Kling-2.5、Seedance-v1-pro、Hailuo-02等位居榜单前列[14] 社区影响力与下载量 - 趋势榜中,蚂蚁Ling-1T和智谱GLM-4.6是最受关注的开源模型[16] - DeepSeek-R1是最受欢迎模型[17] - Qwen3是下载量最高的模型之一,在百亿参数级别领先包括gpt-oss在内的其他开源模型[18] - Qwen/Qwen3-0.6B模型下载量达6.86M,Qwen/Qwen3-32B下载量达6.24M[19] 全球竞争格局变化 - 开源模型领域主导地位转变可能重新定义全球创新格局[21] - Meta的Llama 4翻车为中国开源模型崛起提供了机会[24] - Meta以35亿美元offer挖走OpenAI前CTO公司联创Andrew Tulloch,引发对Llama 5的期待[25][26]
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
虎嗅· 2025-10-03 12:53
Meta AI研究政策变动 - Meta对FAIR实验室实施新政策,要求所有研究成果在公开发表前必须通过额外的内部审查[2] - 新政策限制了研究人员的学术自由,引发FAIR内部强烈反对,员工认为这剥夺了他们自由分享研究成果的权利[3] - 政策变化反映公司战略转向,要求FAIR更多为内部产品服务,减少可能助益竞争对手的外部研究分享[4] 管理层人事动荡 - FAIR联合创始人Yann LeCun对Meta超级智能实验室(MSL)内部状况日益失望,曾在9月考虑辞去首席科学家职位[5][6] - LeCun对外界"被降职"的看法感到恼火,尽管最终被允许继续专注研究,但紧张气氛已形成[6] - Meta从OpenAI挖来研究员赵晟佳担任MSL首席科学家,引发内部权力结构变化[6] 新组织架构整合 - Meta超级智能实验室被重组为四个小组:TBD Lab、产品与应用研究团队、基础设施团队和FAIR[9][14] - 新组织承载Meta多年来最大赌注,需要协调所有员工步调一致[10] - 为聘请前Scale AI首席执行官Alexandr Wang,Meta达成价值143亿美元交易,并授予Wang本人价值超过2亿美元股票[10] 内部文化冲突 - 新旧团队出现紧张关系,元老级研究员对新部门的保密文化和新同事的天价薪酬感到不满[7][16] - 前研究员将Meta之前Gen AI部门文化描述为"抢占地盘、狙击项目、窃取成果",比作"转移性癌症"[11] - TBD Lab要求研究员每周五天现场办公,而其他AI研究员通常只需每周到岗三天,引发混合办公员工反感[17] 资源分配与工作环境 - TBD Lab作为明星项目获得最多资源和关注,但催生高压、无情的工作氛围[15][16] - 部分被邀请研究员拒绝加入TBD Lab,老员工因薪酬差距不愿加入新团队[15][16] - 人事持续动荡,例如Alexandr Wang的幕僚长Bill Long于6月加入但现已返回Scale[18] 产品管理权变更 - Meta AI聊天机器人应用从首席产品官Chris Cox团队划归超级智能实验室管理[13] - 该应用准备增加AI生成短视频信息流时,遭到Reality Labs可穿戴设备团队成员公开反对[13][14] 领导层改进尝试 - 联合领导人Nat Friedman在8月会议上表示希望赋予技术团队更多权力,减少繁文缛节和内部会议频率[19] - 新领导层面临整合挑战,需要理顺内部文化以实现CEO对"超级智能"的宏大愿景[11][20]
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
机器之心· 2025-10-03 11:39
Meta AI业务重组与内部冲突 - Meta对FAIR实验室实施新政策,要求所有研究成果在公开发表前必须通过额外的内部审查[2] - 该政策限制了研究人员的学术自由,引发FAIR内部强烈反对,多位员工认为这破坏了吸引顶尖人才的开放研究氛围[5] - FAIR联合创始人Yann LeCun对此深感困扰,曾在9月份私下考虑辞去首席科学家职位[6] 新领导层与组织架构调整 - Meta于6月聘请前Scale AI首席执行官Alexandr Wang和前GitHub首席执行官Nat Friedman共同领导新成立的超级智能实验室(MSL)[11] - 为聘请Wang,Meta与Scale达成价值143亿美元的交易,并授予Wang本人价值超过2亿美元的股票[12] - 8月该部门被重组为四个小组:TBD Lab(开发Llama 5)、产品与应用研究团队、基础设施团队和FAIR[18] 内部文化冲突与人才管理问题 - 新成立的超级智能实验室导致"新旧两派"紧张关系,元老级研究员对新部门的保密文化及新同事的天价薪酬感到不满[8] - TBD Lab要求研究员每周五天现场办公,而Meta其他AI研究员通常只需每周到岗三天,引发混合办公员工反感[15] - 人事动荡持续,例如Alexandr Wang的幕僚长Bill Long于6月加入Meta但现已返回Scale[16] 产品整合与内部阻力 - Meta AI聊天机器人应用从首席产品官Chris Cox团队划归超级智能实验室管理[15] - 该应用在9月准备增加AI生成的短视频信息流(Vibes)时,遭到Reality Labs可穿戴设备团队成员的公开反对[15] - TBD Lab虽为明星项目,但一些被邀请的研究员拒绝了offer,部分原因是高压工作氛围和薪酬差距[15] 领导层回应与整合挑战 - Meta发言人声明"研究是MSL主要支柱之一,没有限制研究人员发表论文",并强调LeCun作为FAIR首席科学家的角色没有改变[13] - Nat Friedman在8月会议上表示希望赋予技术成员更多权力,减少繁文缛节和内部会议频率[16] - 新组织仍处于早期整合阶段,面临理顺内部文化的巨大挑战,前研究员将之前Gen AI部门文化描述为"抢占地盘、狙击项目、窃取成果"[13]
143亿美金,扎克伯格砸出一地鸡毛
36氪· 2025-09-02 17:49
公司战略与投资 - Meta斥资143亿美元(约1000亿元人民币)收购Scale AI并高薪挖角AI顶尖人才[4] - 公司同时收购语音AI初创公司Play AI和WaveForms AI并与Midjourney在文生图领域达成合作[39] - 在美国多地建设大型数据中心包括造价500亿美元的路易斯安那州Hyperion超大数据中心[40][41] 组织架构调整 - 公司重组AI部门成立超级智能实验室(MSL)下设TBD Lab、FAIR、PAR和MSL Infra四个子机构[48] - TBD Lab由Alexandr Wang领导负责下一代Llama研发FAIR由Yann LeCun负责但需向Alexandr Wang汇报[52][53][54] - 原有AGI基础小组解散AI产品小组负责人转至Threads项目[49][50] 人才流动与薪酬问题 - 新员工年薪包达数百万美元而老员工年薪普遍仅数十万美元导致严重薪资倒挂[61] - 前OpenAI研究员赵晟佳入职数日后获"首席AI科学家"头衔留任[71][72][73] - 多名高端人才短期离职包括前OpenAI研究员Ethan Knight、Avi Verma和谷歌DeepMind的Rishabh Agarwal[78] 合作与数据质量争议 - Scale AI数据质量被内部研究人员质疑Meta转向与竞争对手Mercor和Surge合作[14][17][21] - Scale AI依赖众包模式导致数据质量不足而Surge与Mercor采用高薪专业人才模式[17][20] - OpenAI和谷歌宣布停止与Scale AI合作后者裁员200名数据标注员工[24][25] 内部管理问题 - 新老员工均对资源分配不满新员工未获得承诺资源老员工被边缘化[59][63] - Alexandr Wang被指管理方式傲慢与扎克伯格多次冲突加剧团队矛盾[78] - MSL办公区需两层安保和特殊权限工牌体现资源高度集中[60] 研发进展与挑战 - MSL已着手研发下一代AI模型Llama 5但成效仍待观察[79][80] - 公司被曝在内部编程工具中使用Anthropic和OpenAI模型[7]
小扎砸了143亿的Scale AI,已与Meta“闹掰”?曝挖来的高管2个月就走人,数据质量也遭嫌弃
36氪· 2025-09-02 07:31
高管变动与整合问题 - Scale AI前高管Ruben Mayer加入Meta不到两个月即离职 曾担任生成式AI产品与运营高级副总裁[1][3] - Mayer本人声称离职属个人原因 并强调自己从第一天就是TBD Labs核心部门成员[3] - 部分被Alexandr Wang带来的高管未进入TBD Labs核心研发团队[5][6] 数据合作与质量争议 - Meta在模型训练中继续使用Scale AI竞争对手Surge和Mercor的数据标注服务[4] - 多名Meta研究人员直言Scale AI数据质量不佳[4] - 公司发言人坚称Scale AI数据不存在质量问题[4] 行业竞争格局变化 - OpenAI和谷歌在Meta投资后宣布停止使用Scale AI服务[4] - Scale AI随后裁减200名数据标注员工 归因于市场需求变化[4] - AI实验室行业惯例为同时与多个数据标注厂商合作[4] 人才流失与团队动荡 - 来自OpenAI和Scale AI的新研究员对Meta繁琐流程不满 部分已闪电离职[5] - Meta原有GenAI团队被边缘化 多名老员工选择离职[5] - MSL新老团队存在摩擦 顶尖人才招得来却留不住[5] 战略方向与合作伙伴关系 - 内部高层讨论整合谷歌Gemini或OpenAI模型至Meta应用[7] - 部分内部工具已整合Anthropic模型 如代码助手调用Claude进行编程[7] - 公司声称采取全面策略:自建模型 与外部合作 坚持开源并行[7] 投资规模与市场反应 - Meta对Scale AI投资金额达143亿美元[1][4] - 外界质疑巨额人才投入(数百万美元年薪)可能仅用于调用外部API[7] - 专业人士认为外部合作属权宜之计 最终目标为推动Llama 5与竞争对手抗衡[7]
143亿美金买来一场空,小扎向谷歌OpenAI低头,史上最大AI赌注失速
36氪· 2025-09-01 14:26
核心观点 - Meta因Llama 4性能评测造假丑闻声誉受损 随后以143亿美元收购Scale AI并高薪挖角AI人才 但引发管理混乱、团队内讧及人才流失问题 同时与Scale AI的合作关系出现裂缝[1][3][15] 战略投资与收购 - 公司斥资143亿美元(约1000亿元)收购Scale AI 旨在强化AI领域布局[1][11] - 同时收购语音AI初创公司Play AI和WaveForms AI 并与图像生成公司Midjourney达成合作[2][19] - 在美国多地建设大型数据中心 包括造价500亿美元的路易斯安那州Hyperion超大数据中心[19] 人才流动与组织架构 - 通过九位数年薪(上亿美元)挖角OpenAI、谷歌DeepMind、Anthropic等公司的顶尖研究员[17][18] - 重组AI部门成立超级智能实验室(MSL) 下设4个子机构:TBD Lab(由Alexandr Wang领导)、FAIR(Yann LeCun负责)、PAR(Nat Friedman领导)、MSL Infra[25][26][28] - 但出现大规模人才流失:前OpenAI研究员Ethan Knight、Avi Verma及谷歌DeepMind的Rishabh Agarwal仅在岗数月便离职 老员工也因资源分配不公大量出走[31][34][35] 管理问题与内部矛盾 - 薪资差距悬殊:老员工年包约数十万美元 新员工可达上亿美元 导致严重不满[28][29] - 资源分配向MSL倾斜 老部门员工被边缘化 计算资源遭挤压[28] - Alexandr Wang被指管理方式傲慢 与扎克伯格多次冲突 且其缺乏AI研究背景引发质疑[21][35] 合作关系变化 - 与Scale AI合作出现裂缝:TBD Lab转而与竞争对手Mercor和Surge合作 此前对Scale AI的数十亿美元投入效果存疑[3][6][9] - Scale AI数据质量被内部评价为"差到不能用" 因其依赖众包模式 而竞争对手采用高薪专业人才模式[7][9] - OpenAI和谷歌已停止与Scale AI合作 后者于7月裁员200名数据标注员工[9] 运营动态 - 前Scale AI高管Ruben Mayer仅在Meta任职两个月即离职[4] - 公司内部使用竞争对手模型:在编程工具中采用Anthropic和OpenAI模型 文生图领域与Midjourney合作[2] - 为留住人才采取紧急措施 如为前OpenAI研究员赵晟佳(Shengjia Zhao)授予"首席AI科学家"头衔[32]
腾讯研究院AI速递 20250901
腾讯研究院· 2025-09-01 00:02
生成式AI行业动态 - xAI正式发布编码模型Grok Code Fast 1 该模型从零打造 速度比GPT-5快五倍 性价比高 性能进入全球编码模型前五名[1] - 模型架构聚焦真实编程任务 支持多语言 具备全栈开发与bug修复能力 研发团队以华人学者为主 通过用户反馈迭代优化 并公布多模态与视频生成路线图[1] - Meta因内部旗舰模型进展缓慢 Llama 5尚未成型 正寻求与OpenAI或谷歌合作为旗下应用注入AI 已在内部工具接入外部模型[2] - OpenAI发布语音模型GPT-realtime 具备超自然语音生成 情感语调模仿与多模态理解 准确率与推理能力显著提升 支持指令遵循 函数调用 异步对话与图像输入[3] - Realtime API同步上线 扩展SIP连接 复用提示 内置安全防护 以更低价格开放 推动语音AI智能体落地[3] - Claude更新隐私政策 默认允许收集用户对话与编程数据用于模型训练 不同意则仅保留30天 涵盖免费及付费用户[4] - 美团开源龙猫大模型LongCat-Flash 采用5600亿参数MoE架构 创新引入零计算专家和ScMoE 大幅提升效率与速度[5] - 模型在MMLU ArenaHard CEval等基准表现接近或超越DeepSeek V3.1与Qwen3 指令遵循与Agent任务排名领先 支持128k上下文 推理速度超100TPS 成本仅0.7美元/百万词元[5] - 全球七大LLM参加狼人杀210场对战 GPT-5以96.7%胜率领先 展现超强社交推理与操纵能力[6] - 作为狼人时以逻辑框架与心理战精准瓦解对手 作为村民时靠司法化调查体系抵抗操纵 零误伤关键角色[7] - xAI创始工程师李雪辰套现约700万美元股票后 被指窃取Grok核心代码库并叛逃至OpenAI xAI已提起诉讼指控盗取数十亿美元级别商业机密[8] 前沿科技研究进展 - 清华姚班本科生提出分层规划+强化学习框架 让宇树G1机器人在0.42秒内反应击球 连续对拉达106拍[9] - 高层规划器预测乒乓球轨迹与击球时机 低层RL控制器生成协调动作 融入人类动作参考提升击球自然性 实验中击球率96.2% 回球率92.3%[9] AI硬件投资视角 - a16z合伙人指出AI被局限在网页文本框 需通过硬件实现更自然交互 硬件优势在于被动收集语境信息让AI更精准有价值[10] - 关键突破点在于形态因子社会可接受 功能compelling 场景明确 成功路径是找到精确 有价值 社会认可的应用场景[10]
Meta超级智能实验室权力架构曝光:汪韬直接领导30名顶尖研究员
36氪· 2025-07-18 17:58
Meta超级智能实验室成立与高管变动 - Meta近期从OpenAI、谷歌和xAI等竞争对手处挖角顶尖人才,成立超级智能实验室,由前Scale AI首席执行官汪韬和前GitHub首席执行官奈特·弗里德曼领导,团队规模约3400人[3][5] - 汪韬被任命为Meta首席人工智能官,弗里德曼担任Meta副总裁,负责AI产品与应用研究,两人共同领导包括AGI Foundations、AI助手产品团队、基础AI研究实验室等在内的多个团队[5][7] - 实验室安保措施严格,需通过双重检查并持有特殊权限门禁卡才能进入,突显项目机密性质[3] 人才招募与组织架构 - Meta通过高薪挖角竞争对手研究员,薪酬包达到NBA球星级别,近期招募了来自OpenAI、Google DeepMind和xAI的多名顶尖研究员[7][8] - 约30名员工直接向汪韬汇报,这些下属几乎全部是从竞争对手实验室挖来的顶级研究员,包括七位此前未公开身份的员工[7] - 公司投入巨额资金吸引人才,包括投资Scale AI 143亿美元聘用汪韬,并计划以超十亿美元收购弗里德曼和丹尼尔·格罗斯的风险投资基金股权[7] Llama模型研发与战略调整 - Llama 4表现不佳,Meta计划改进架构与数据训练策略,部分工作已外包给其他公司[10] - 公司新建Llama 5研究实验室,许多老员工争相加入,未被选中者需继续改进Llama 4版本[9] - 汪韬等高管建议改变模型发布战略,考虑不再将最先进模型开源,以集中精力开发超级智能和自有产品[11] 资源投入与竞争优势 - Meta计划在计算资源上投资数千亿美元,以支持超级智能研发,算力资源成为吸引顶尖人才的关键优势[8][12] - 公司向潜在员工强调未来超级智能将带来更多空闲时间,Meta可提供娱乐服务,以此作为招聘策略的一部分[11] - 扎克伯格表示算力资源不仅用于工作,更是吸引最优秀人才的重要手段[12] 行业动态与竞争格局 - Meta的超级智能实验室是近年来最大战略赌注,旨在扭转AI领域困境并实现扎克伯格的"超级智能"愿景[7] - 公司面临将大量新招聘研究人员融入现有团队的挑战,需确保新老员工协同工作[9] - 开源模型策略存在争议,部分高管认为闭源模型有助于集中开发超级智能,但公司发言人表示将继续发布领先的开源模型[11]