谷歌DeepMind - 财报，业绩电话会，研报，新闻

谷歌DeepMind

搜索文档

Nature公开谷歌IMO金牌模型技术细节！核心团队仅10人，一年给AI编出8000万道数学题训练

创业邦· 2025-11-14 18:24

核心观点 - 谷歌DeepMind公开了其数学奥林匹克竞赛金牌模型AlphaProof的完整技术细节，该模型通过将数学证明构建为强化学习游戏并采用创新的训练方法，在2024年IMO中取得突破性成绩[2][4][5] 技术架构与训练方法 - 核心思路是将数学证明过程构建为可训练的强化学习游戏，基于Lean定理证明器创建环境，每个数学命题是一个游戏关卡[7] - 模型采用30亿参数的编码器-解码器transformer架构作为核心证明网络，同时输出策略建议和完成证明的步数估计[8] - 搜索算法受AlphaZero启发但做了关键改进，引入AND-OR树结构处理多个独立子目标，并加入渐进采样机制[9] - 预训练使用了约3000亿个token的代码和数学文本，微调使用了Mathlib库中约30万个人工编写的证明[9] - 通过基于Gemini 1.5 Pro开发的翻译系统，将约100万道自然语言数学题转换成约8000万道形式化问题，极大扩充了训练数据[10] - 主训练阶段消耗了约8万TPU天的计算资源，通过主强化学习循环和测试时强化学习循环协同工作[10][13] 团队与开发过程 - 团队规模较小，大部分时间约10人，临近IMO比赛时才有更多人加入[4] - 核心突破来自IMO金牌得主Miklós Horváth提出的方法，即创建问题变体作为初始状态进行训练[4] - 团队在一年中探索了多种研究思路，失败的经验与成功的经验最终都被整合进AlphaProof系统[5] IMO表现与测试时强化学习 - 在2024年IMO上成功解决了代数和数论的三道题，包括最难的P6题，该题609名参赛选手中仅5人完全解出[15] - 关键机制是测试时强化学习，针对每道难题生成约40万个相关变体，专门训练“专家”模型来攻克原题[13][15] - 每道题的TTRL过程需要2-3天计算时间，最终成绩达到金牌水平[15][16] 能力评估与行业应用前景 - 系统已向科学界开放，数学家试用反馈显示其特别擅长找出反例，能帮助快速调整和修正数学陈述[20] - 在处理Mathlib已有概念的数学子领域表现出色，但在面对充满“定制化定义”的全新概念时存在瓶颈[20] - 面临的行业挑战包括对持续演进的Lean定理证明器的依赖，以及数学题数据的有限性，未来需拓展问题自动生成能力[20] - 该方法展示了AI在封闭数学系统中共享知识并生成训练数据的潜力，预示其在数学领域可能超越人类[20]

AI招聘独角兽Mercor完成C轮融资估值达100亿美元

智通财经网· 2025-10-28 11:20

这家初创公司在一篇博客文章中这样写道，目前公司每天向合作专家支付的报酬超过 150 万美元;其平台注册专家已超 3 万名，平均时薪超过 85 美元;并且通过"分享无法仅通过代码体现的知识、经验和背景信息来教导代理商更像人类地思考"。据报道，Meta向数据标注初创公司 Scale AI 投资 140 亿美元并聘用其首席执行官后，企业对 Scale AI 的中立性产生了担忧，OpenAI、谷歌DeepMind 等头部 AI 实验室均终止了与 Scale AI 的合作，而 Mercor 则借此机会承接了更多需求。联合创始人Adarsh Hiremath说道："这种情况在初创企业中并不常见，因为通常你的最大竞争对手也不会在一夜之间就被彻底击垮。" 这家初创公司在数据标注领域仍面临竞争，其中包括与 Scale AI 相竞争的 Surge AI 公司。据报道， Surge AI 正计划进行新一轮融资，目标金额高达 10 亿美元。3 月份，Turing AI 的估值达到 22 亿美元，而Invisible Technologies在 9 月份完成了一轮 1 亿美元的融资，使其估值超过 20 亿美元。智通财经 ...

Artificial Intelligence

田渊栋被裁后新offer排到法国！原来Llama 4.5训完后被卸磨杀驴了

量子位· 2025-10-24 14:23

裁员事件概述 - Meta近期裁撤约600名员工，裁员执行迅速，员工被通知后立即失去内部系统访问权限[1] - 此次裁员被视为公司年度中期精简计划推迟实施的结果，裁员名单早在2025年6-7月就已确定[18] - 公司内部未公开宣布被裁人员名单，导致内部员工需通过私下交流确认去留情况[11][12] 裁员背景与动机 - 官方备忘录显示裁员目的是使团队"更精、更快、更有影响力"，通过缩小团队规模减少决策对话，使员工承担更多责任[15][16] - 实际背景可能与Llama 4项目表现未达预期有关，有观点认为裁员是为项目失利寻找负责人[2][3] - 裁员时机选择在Llama 4.5训练接近完成后，被形容为"卸磨杀驴"[9][19][20][22] 受影响团队与人员构成 - FAIR研究院的田渊栋整个团队被裁，该团队在Llama 4发布前两个月被转向GenAI部门处理后期训练工作，并在发布后负责修复bug[4] - 匿名平台统计显示产品应用研究软件工程师占比最高达31.9%，基础设施软件工程师占27.7%，FAIR研究院的软件工程师和研究科学家各占4.3%[15] - FAIR London团队预计将被整体裁撤，欧盟地区裁员情况尚不明确[13] 遣散方案与后续安排 - 被裁员工正式离职日期定为2025年11月21日，之前处于"非工作通知期"，保留薪资但无系统访问权限，被鼓励内部转岗[23][24] - 遣散费包括16周基本薪资，并按工龄每满一年额外支付2周薪资，但需扣除通知期对应部分[26] - 资深员工田渊栋获得8个月薪资赔偿，并迅速收到多家头部AI公司的工作邀请[30][32][33] 公司战略调整迹象 - Llama项目领导权发生变更，从2023年初由GenAI组织负责，现已移交至新成立的TBD Lab[9] - 公司宣布将裁撤风控部门，转向使用人工智能自动化合规审查流程[50][51] - 有迹象表明裁员可能持续，非TBD部门的员工可能在明年2月面临新一轮裁员[27]

Meta Platforms(US:META)

人工智能

Artificial Intelligence

Llama 4

Llama 4.5

人工智能

Artificial Intelligence

Llama 4

Llama 4.5

新晋诺得主警告：别做梦了，AI难有「经济奇点」

36氪· 2025-10-15 15:18

2024年诺贝尔奖与AI关联性 - 2024年被称为诺贝尔奖的AI元年，谷歌量子AI首席量子硬件科学家Michel Devoret因量子硬件研究获物理学奖，谷歌DeepMind的Demis Hassabis和John Jumper因AlphaFold2获化学奖 [1][3] - 新晋诺贝尔经济学奖得主Joel Mokyr、Philippe Aghion和Peter Howitt的研究与AI关系密切，其创新理论为理解AI对经济增长的影响奠定基础 [2][7] 创造性破坏理论 - 经济学家Philippe Aghion和Peter Howitt因构建"创造性破坏"数学模型获奖，该理论指出创新在创造新事物的同时会淘汰技术落伍的企业 [10][11] - 创造性破坏可能引发社会矛盾，若既得利益集团阻挠创新，经济增长将面临停滞风险 [13][14][16] AI对经济增长的影响机制 - AI被定义为自动化进程的最新形态，可能攻克非程序化任务和高技能领域，借助历史经验构建经济增长模型 [18][20][22] - AI对经济增长的促进作用可能受"鲍莫尔成本病"制约，即生产率增长缓慢的部门成本上升会拖累整体经济增长 [23][26][27] - 即便AI能自动化99%的任务，经济增长仍受制于1%关键物理规律限制的任务，如能源生产和商品制造 [31][32] AI研发范式变革 - AI增强的研发更依赖资本投入而非劳动力，资本可无限积累的特性可能使研究人员生产力永久提升 [34][35] - 深度学习等AI技术若广泛传播，美国经济增长率或许能翻倍，这种资本密集型研发可能克服鲍莫尔病的阻力 [33][35] 技术应用与经济增长关系 - 历史上电力、内燃机等技术突破都经历数十年滞后期才被广泛应用，AI的影响也可能因配套环境不足而受限 [29] - 超级AI可能加剧"商业掠夺效应"，抑制人类创新投入，最终导致经济增长放缓甚至停滞 [29]

马斯克痛失xAI大将，Grok 4缔造者突然离职

虎嗅· 2025-08-14 09:46

公司发展历程 - 2023年初埃隆与Igor Babuschkin会面并探讨AI未来共同认为需要创建新型AI公司[1] - xAI在两年时间内取得显著成就包括打造世界最大AI超算和开发多模态模型[2] - 公司在120天内极限建造Colossus超级计算集群并训练出比肩OpenAI和谷歌DeepMind的Grok 4模型[3] - 原始12人创始团队中已有3人离职包括Kyle Kosic重返OpenAI和Christian Szegedy加入Morph Labs[64][65] - 目前创始团队剩余9人其中华人学者占比超过1/5[65][62] 技术成就 - 开发孟菲斯超级计算集群Colossus 为Grok大规模训练提供算力支持[18] - 成功训练多模态Grok 4模型能力可与Gemini 2.5和GPT-5相媲美[19] - 团队执行速度极快在120天内完成被认为不可能的超算集群建设[37] - 开源Grok-1模型并发布代码库[12] - 一天内审核15,000份申请展现高效运营能力[12] 人才团队 - Igor Babuschkin曾担任谷歌DeepMind高级研发工程师主导AlphaStar项目[9][10] - 参与WaveNet语音系统开发提升语音合成自然度与质量[11] - 曾在OpenAI参与GPT-4等核心技术的研发工作[13] - 拥有德国多特蒙德工业大学物理学硕士学位[17] - 团队包含来自谷歌DeepMind、微软和OpenAI的顶尖研究人员[60] 未来规划 - xAI计划在2025年7月发布Grok 4 随后推出编码模型、多模态代理和视频生成模型[21] - Igor Babuschkin宣布创办风险投资公司Babuschkin Ventures 专注于AI安全研究和投资AI初创公司[5][56] - 新投资公司将支持推动人类进步和解开宇宙之谜的AI系统[56] - 公司致力于创造对人类安全且有益的AI[55]

泄露文件揭马斯克xAI语音训练内幕：真人对话模拟时薪低至12美元

36氪· 2025-06-06 20:48

媒体获取了四份Scale AI的内部文件，这些文件详细阐述了为xAI服务的"Xylophone项目"的运作机制。这些文件未明确指出具体训练的是 xAI的哪一款模型。今年2月底，马斯克宣布为其公司目前唯一公开的AI模型Grok推出语音模式的测试版。 Scale AI的项目表显示，参与"Xylophone项目"的承包商需录制简短对话，重点关注"音频质量与自然流畅度"，尤其鼓励具备配音经验者参与。项目表显示，该项目致力于实现"引人入胜的脚本、卓越的配音技艺及高保真音质"。针对"Xylophone项目"，分布全球的零工工作者可从涉及伦理、哲学、商业、旅行等领域的数百个对话主题中挑选，并以多种语言录制回答。项目工作分为两部分：其一为"对话"，由3名零工组成小组协作完成；其二为"草原之声"（ Grasslands），由个体独立完成。在"对话"子项目中，小组需通过Zoom平台模拟真实对话场景。参与者轮流从提示表格中选取问题提问。该表格囊括逾700条涵盖广泛议题的对话引言，主题包括末世生存策略、印度旅行规划、以及焦虑与惊恐发作管理等。 6月6日消息，据媒体获取的文件显示，埃隆·马斯克旗下的人工智能公司xAI正利用一 ...

Artificial Intelligence

Grok

Artificial Intelligence

Grok

【财经早晚报】中国对巴西等5国试行免签；娃哈哈回应今麦郎代工；王化回应有人扩散小米汽车销量

搜狐财经· 2025-05-15 17:57

宏观政策与市场动态 - 最高人民法院与中国证监会联合发布指导意见，提出常态化开展证券纠纷代表人诉讼，降低投资者维权成本，完善虚假陈述民事赔偿责任制度 [1] - 中国证券业协会修订《证券纠纷调解规则》，明确调解原则与程序，引入小额速调机制，降低投资者维权成本 [2] - 中方宣布对巴西、阿根廷等5国试行免签政策，自2025年6月起实施，促进中外人员往来便利化 [2] - 中国牵头制定的适老化数字经济国际标准ISO 25556:2025发布，涵盖在线购物、数字银行等老年人高频场景 [3][4] 资本市场表现 - 创业板指下跌1.91%，沪深两市成交额1.15万亿元，较前一交易日缩量1643亿元，超3800只个股下跌 [4] - 合成生物、食品、ST板块逆势上涨，算力、软件开发等板块跌幅居前 [4] - 高盛上调MSCI中国指数目标至84点（潜在上涨11%），沪深300指数目标至4600点（潜在上涨17%），建议关注互联网、区域银行及基建产业链 [5] 国际贸易与商品市场 - 中美互降关税后，中国至美国集装箱运输预订量飙升277%，从5709标准集装箱增至21530标准集装箱 [5] - WTI原油和布伦特原油价格均跌超3%，分别报60.60美元/桶和63.97美元/桶 [5] 科技与人工智能进展 - OpenAI向ChatGPT用户开放GPT-4.1模型，专攻编码任务，Plus/Pro/Team用户可优先访问 [6][7] - 谷歌DeepMind推出编程AI Agent AlphaEvolve，优化算法设计并在11维空间解决亲吻数问题 [7] 公司动态 - 娃哈哈回应代工争议，称因产能紧张委托今麦郎生产，现已完成18条高速产线布局并新建工厂 [6] - 小米集团回应销量质疑，称假期消费周期影响数据，批评扩散信息者"不专业" [7]