谷歌DeepMind
搜索文档
Nature公开谷歌IMO金牌模型技术细节!核心团队仅10人,一年给AI编出8000万道数学题训练
创业邦· 2025-11-14 18:24
核心观点 - 谷歌DeepMind公开了其数学奥林匹克竞赛金牌模型AlphaProof的完整技术细节,该模型通过将数学证明构建为强化学习游戏并采用创新的训练方法,在2024年IMO中取得突破性成绩[2][4][5] 技术架构与训练方法 - 核心思路是将数学证明过程构建为可训练的强化学习游戏,基于Lean定理证明器创建环境,每个数学命题是一个游戏关卡[7] - 模型采用30亿参数的编码器-解码器transformer架构作为核心证明网络,同时输出策略建议和完成证明的步数估计[8] - 搜索算法受AlphaZero启发但做了关键改进,引入AND-OR树结构处理多个独立子目标,并加入渐进采样机制[9] - 预训练使用了约3000亿个token的代码和数学文本,微调使用了Mathlib库中约30万个人工编写的证明[9] - 通过基于Gemini 1.5 Pro开发的翻译系统,将约100万道自然语言数学题转换成约8000万道形式化问题,极大扩充了训练数据[10] - 主训练阶段消耗了约8万TPU天的计算资源,通过主强化学习循环和测试时强化学习循环协同工作[10][13] 团队与开发过程 - 团队规模较小,大部分时间约10人,临近IMO比赛时才有更多人加入[4] - 核心突破来自IMO金牌得主Miklós Horváth提出的方法,即创建问题变体作为初始状态进行训练[4] - 团队在一年中探索了多种研究思路,失败的经验与成功的经验最终都被整合进AlphaProof系统[5] IMO表现与测试时强化学习 - 在2024年IMO上成功解决了代数和数论的三道题,包括最难的P6题,该题609名参赛选手中仅5人完全解出[15] - 关键机制是测试时强化学习,针对每道难题生成约40万个相关变体,专门训练“专家”模型来攻克原题[13][15] - 每道题的TTRL过程需要2-3天计算时间,最终成绩达到金牌水平[15][16] 能力评估与行业应用前景 - 系统已向科学界开放,数学家试用反馈显示其特别擅长找出反例,能帮助快速调整和修正数学陈述[20] - 在处理Mathlib已有概念的数学子领域表现出色,但在面对充满“定制化定义”的全新概念时存在瓶颈[20] - 面临的行业挑战包括对持续演进的Lean定理证明器的依赖,以及数学题数据的有限性,未来需拓展问题自动生成能力[20] - 该方法展示了AI在封闭数学系统中共享知识并生成训练数据的潜力,预示其在数学领域可能超越人类[20]
AI招聘独角兽Mercor完成C轮融资 估值达100亿美元
智通财经网· 2025-10-28 11:20
这家初创公司在一篇博客文章中这样写道,目前公司每天向合作专家支付的报酬超过 150 万美元;其平 台注册专家已超 3 万名,平均时薪超过 85 美元;并且通过"分享无法仅通过代码体现的知识、经验和背 景信息来教导代理商更像人类地思考"。 据报道,Meta向数据标注初创公司 Scale AI 投资 140 亿美元并聘用其首席执行官后,企业对 Scale AI 的 中立性产生了担忧,OpenAI、谷歌DeepMind 等头部 AI 实验室均终止了与 Scale AI 的合作,而 Mercor 则借此机会承接了更多需求。 联合创始人Adarsh Hiremath说道:"这种情况在初创企业中并不常见,因为通常你的最大竞争对手也不 会在一夜之间就被彻底击垮。" 这家初创公司在数据标注领域仍面临竞争,其中包括与 Scale AI 相竞争的 Surge AI 公司。据报道, Surge AI 正计划进行新一轮融资,目标金额高达 10 亿美元。3 月份,Turing AI 的估值达到 22 亿美元, 而Invisible Technologies在 9 月份完成了一轮 1 亿美元的融资,使其估值超过 20 亿美元。 智通财经 ...
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
量子位· 2025-10-24 14:23
裁员事件概述 - Meta近期裁撤约600名员工,裁员执行迅速,员工被通知后立即失去内部系统访问权限[1] - 此次裁员被视为公司年度中期精简计划推迟实施的结果,裁员名单早在2025年6-7月就已确定[18] - 公司内部未公开宣布被裁人员名单,导致内部员工需通过私下交流确认去留情况[11][12] 裁员背景与动机 - 官方备忘录显示裁员目的是使团队"更精、更快、更有影响力",通过缩小团队规模减少决策对话,使员工承担更多责任[15][16] - 实际背景可能与Llama 4项目表现未达预期有关,有观点认为裁员是为项目失利寻找负责人[2][3] - 裁员时机选择在Llama 4.5训练接近完成后,被形容为"卸磨杀驴"[9][19][20][22] 受影响团队与人员构成 - FAIR研究院的田渊栋整个团队被裁,该团队在Llama 4发布前两个月被转向GenAI部门处理后期训练工作,并在发布后负责修复bug[4] - 匿名平台统计显示产品应用研究软件工程师占比最高达31.9%,基础设施软件工程师占27.7%,FAIR研究院的软件工程师和研究科学家各占4.3%[15] - FAIR London团队预计将被整体裁撤,欧盟地区裁员情况尚不明确[13] 遣散方案与后续安排 - 被裁员工正式离职日期定为2025年11月21日,之前处于"非工作通知期",保留薪资但无系统访问权限,被鼓励内部转岗[23][24] - 遣散费包括16周基本薪资,并按工龄每满一年额外支付2周薪资,但需扣除通知期对应部分[26] - 资深员工田渊栋获得8个月薪资赔偿,并迅速收到多家头部AI公司的工作邀请[30][32][33] 公司战略调整迹象 - Llama项目领导权发生变更,从2023年初由GenAI组织负责,现已移交至新成立的TBD Lab[9] - 公司宣布将裁撤风控部门,转向使用人工智能自动化合规审查流程[50][51] - 有迹象表明裁员可能持续,非TBD部门的员工可能在明年2月面临新一轮裁员[27]
新晋诺得主警告:别做梦了,AI难有「经济奇点」
36氪· 2025-10-15 15:18
2024年诺贝尔奖与AI关联性 - 2024年被称为诺贝尔奖的AI元年,谷歌量子AI首席量子硬件科学家Michel Devoret因量子硬件研究获物理学奖,谷歌DeepMind的Demis Hassabis和John Jumper因AlphaFold2获化学奖 [1][3] - 新晋诺贝尔经济学奖得主Joel Mokyr、Philippe Aghion和Peter Howitt的研究与AI关系密切,其创新理论为理解AI对经济增长的影响奠定基础 [2][7] 创造性破坏理论 - 经济学家Philippe Aghion和Peter Howitt因构建"创造性破坏"数学模型获奖,该理论指出创新在创造新事物的同时会淘汰技术落伍的企业 [10][11] - 创造性破坏可能引发社会矛盾,若既得利益集团阻挠创新,经济增长将面临停滞风险 [13][14][16] AI对经济增长的影响机制 - AI被定义为自动化进程的最新形态,可能攻克非程序化任务和高技能领域,借助历史经验构建经济增长模型 [18][20][22] - AI对经济增长的促进作用可能受"鲍莫尔成本病"制约,即生产率增长缓慢的部门成本上升会拖累整体经济增长 [23][26][27] - 即便AI能自动化99%的任务,经济增长仍受制于1%关键物理规律限制的任务,如能源生产和商品制造 [31][32] AI研发范式变革 - AI增强的研发更依赖资本投入而非劳动力,资本可无限积累的特性可能使研究人员生产力永久提升 [34][35] - 深度学习等AI技术若广泛传播,美国经济增长率或许能翻倍,这种资本密集型研发可能克服鲍莫尔病的阻力 [33][35] 技术应用与经济增长关系 - 历史上电力、内燃机等技术突破都经历数十年滞后期才被广泛应用,AI的影响也可能因配套环境不足而受限 [29] - 超级AI可能加剧"商业掠夺效应",抑制人类创新投入,最终导致经济增长放缓甚至停滞 [29]
马斯克痛失xAI大将,Grok 4缔造者突然离职
虎嗅· 2025-08-14 09:46
公司发展历程 - 2023年初埃隆与Igor Babuschkin会面并探讨AI未来 共同认为需要创建新型AI公司[1] - xAI在两年时间内取得显著成就 包括打造世界最大AI超算和开发多模态模型[2] - 公司在120天内极限建造Colossus超级计算集群 并训练出比肩OpenAI和谷歌DeepMind的Grok 4模型[3] - 原始12人创始团队中已有3人离职 包括Kyle Kosic重返OpenAI和Christian Szegedy加入Morph Labs[64][65] - 目前创始团队剩余9人 其中华人学者占比超过1/5[65][62] 技术成就 - 开发孟菲斯超级计算集群Colossus 为Grok大规模训练提供算力支持[18] - 成功训练多模态Grok 4模型 能力可与Gemini 2.5和GPT-5相媲美[19] - 团队执行速度极快 在120天内完成被认为不可能的超算集群建设[37] - 开源Grok-1模型并发布代码库[12] - 一天内审核15,000份申请 展现高效运营能力[12] 人才团队 - Igor Babuschkin曾担任谷歌DeepMind高级研发工程师 主导AlphaStar项目[9][10] - 参与WaveNet语音系统开发 提升语音合成自然度与质量[11] - 曾在OpenAI参与GPT-4等核心技术的研发工作[13] - 拥有德国多特蒙德工业大学物理学硕士学位[17] - 团队包含来自谷歌DeepMind、微软和OpenAI的顶尖研究人员[60] 未来规划 - xAI计划在2025年7月发布Grok 4 随后推出编码模型、多模态代理和视频生成模型[21] - Igor Babuschkin宣布创办风险投资公司Babuschkin Ventures 专注于AI安全研究和投资AI初创公司[5][56] - 新投资公司将支持推动人类进步和解开宇宙之谜的AI系统[56] - 公司致力于创造对人类安全且有益的AI[55]
泄露文件揭马斯克xAI语音训练内幕:真人对话模拟时薪低至12美元
36氪· 2025-06-06 20:48
媒体获取了四份Scale AI的内部文件,这些文件详细阐述了为xAI服务的"Xylophone项目"的运作机制。这些文件未明确指出具体训练的是 xAI的哪一款模型。今年2月底,马斯克宣布为其公司目前唯一公开的AI模型Grok推出语音模式的测试版。 Scale AI的项目表显示,参与"Xylophone项目"的承包商需录制简短对话,重点关注"音频质量与自然流畅度",尤其鼓励具备配音经验者 参与。项目表显示,该项目致力于实现"引人入胜的脚本、卓越的配音技艺及高保真音质"。 针对"Xylophone项目",分布全球的零工工作者可从涉及伦理、哲学、商业、旅行等领域的数百个对话主题中挑选,并以多种语言录制回 答。项目工作分为两部分:其一为"对话",由3名零工组成小组协作完成;其二为"草原之声"( Grasslands),由个体独立完成。 在"对话"子项目中,小组需通过Zoom平台模拟真实对话场景。参与者轮流从提示表格中选取问题提问。该表格囊括逾700条涵盖广泛议 题的对话引言,主题包括末世生存策略、印度旅行规划、以及焦虑与惊恐发作管理等。 6月6日消息,据媒体获取的文件显示,埃隆·马斯克旗下的人工智能公司xAI正利用一 ...
【财经早晚报】中国对巴西等5国试行免签;娃哈哈回应今麦郎代工;王化回应有人扩散小米汽车销量
搜狐财经· 2025-05-15 17:57
宏观政策与市场动态 - 最高人民法院与中国证监会联合发布指导意见,提出常态化开展证券纠纷代表人诉讼,降低投资者维权成本,完善虚假陈述民事赔偿责任制度 [1] - 中国证券业协会修订《证券纠纷调解规则》,明确调解原则与程序,引入小额速调机制,降低投资者维权成本 [2] - 中方宣布对巴西、阿根廷等5国试行免签政策,自2025年6月起实施,促进中外人员往来便利化 [2] - 中国牵头制定的适老化数字经济国际标准ISO 25556:2025发布,涵盖在线购物、数字银行等老年人高频场景 [3][4] 资本市场表现 - 创业板指下跌1.91%,沪深两市成交额1.15万亿元,较前一交易日缩量1643亿元,超3800只个股下跌 [4] - 合成生物、食品、ST板块逆势上涨,算力、软件开发等板块跌幅居前 [4] - 高盛上调MSCI中国指数目标至84点(潜在上涨11%),沪深300指数目标至4600点(潜在上涨17%),建议关注互联网、区域银行及基建产业链 [5] 国际贸易与商品市场 - 中美互降关税后,中国至美国集装箱运输预订量飙升277%,从5709标准集装箱增至21530标准集装箱 [5] - WTI原油和布伦特原油价格均跌超3%,分别报60.60美元/桶和63.97美元/桶 [5] 科技与人工智能进展 - OpenAI向ChatGPT用户开放GPT-4.1模型,专攻编码任务,Plus/Pro/Team用户可优先访问 [6][7] - 谷歌DeepMind推出编程AI Agent AlphaEvolve,优化算法设计并在11维空间解决亲吻数问题 [7] 公司动态 - 娃哈哈回应代工争议,称因产能紧张委托今麦郎生产,现已完成18条高速产线布局并新建工厂 [6] - 小米集团回应销量质疑,称假期消费周期影响数据,批评扩散信息者"不专业" [7]