Workflow
AlphaGeometry
icon
搜索文档
中国AI变身奥数出题人
新浪财经· 2026-01-28 23:49
技术突破 - 中国科研团队成功开发出全球首个同时具备自主出题、自动解题能力的通用人工智能系统“通矩模型”[1] - 该系统在性能上达到国际顶尖水平,在功能多样性和效率方面实现飞跃[1] - 系统的技术核心在于神经符号引导树搜索架构,将几何世界建模为有限树上的马尔可夫过程,使图形构建变成有序的随机演化过程,避免了无效的重复尝试[1] - 团队创新性地引入“规范化表示”技术,能自动识别、合并对称或同构的拓扑结构,将庞杂的搜索空间压缩几个数量级[1] - 系统在寻找解题“灵感”时,通过价值函数来模拟人类的数学审美[1] 性能与效率 - “通矩模型”仅需一张普通的国产消费级显卡,即可在最多**38分钟**内解决近**25年**来所有的国际数学奥林匹克竞赛的几何难题[1] - 相比谷歌DeepMind的AlphaGeometry需要依赖庞大的算力集群进行训练和推理,“通矩模型”在计算资源需求上显著降低[1] - 该系统遵循“小数据、大任务”的范式,证明了人工智能可以不依赖“暴力计算”,而是通过理解逻辑底层的对称性与美感实现自主科学发现[1] 解决的问题与优势 - 系统成功应对了AI在平面几何领域长期面临的两大挑战:“组合爆炸”(搜索空间呈指数级增长)和“高质量数据匮乏”[1] - 与主要依赖大规模离线合成数据和庞大计算资源的AlphaGeometry相比,“通矩模型”不仅是解题的“优等生”,更是能从无到有创造出具备数学审美价值题目的“金牌教练”[1] - 该成果标志着我国在自动化推理和具身智能的逻辑核心领域实现关键技术自研自控[1] 应用与影响 - 由该系统自主生成的**3道**几何新题已正式入选**2024年**全国中学生数学联赛(北京赛区)及美国精英奥赛,这是AI原创题目首次进入高规格人类数学竞赛[1] - 相关成果近日发表于国际学术期刊《自然·机器智能》[1] - 该成果由北京通用人工智能研究院主导,集结了北京大学多个相关院系的科研力量,体现了我国在通用人工智能基础研究领域“学—研—产”深度融合的正向研发优势[1] 行业意义 - 在人工智能领域,奥林匹克数学竞赛一直被视为衡量机器逻辑思维与空间想象力的重要标准[1] - 平面几何问题因其独特的数值精度与空间直觉的结合,被认为是自动化推理的关键环节[1] - 这一突破标志着我国在相关领域达到国际顶尖水平[1] - 未来,团队将继续沿“小数据,大任务”的研究范式拓展通用人工智能模型,推动中国人工智能实现新突破[1]
从“解题高手”到“金牌教练”,中国AI变身奥数出题人
人民日报· 2026-01-28 22:31
行业技术突破 - 北京通用人工智能研究院与北京大学团队成功开发出全球首个同时具备自主出题、自动解题能力的通用人工智能系统“通矩模型” [1] - 该突破标志着我国在自动化推理和具身智能的逻辑核心领域实现关键技术自研自控 在性能上达到国际顶尖水平 在功能多样性和效率方面实现飞跃 [1] - 相关成果已发表于国际学术期刊《自然·机器智能》 [1] 技术挑战与解决方案 - 在AI几何推理领域 长期面临“组合爆炸”和“高质量数据匮乏”两大挑战 [1] - “通矩模型”采用神经符号引导树搜索架构 将几何世界建模为有限树上的马尔可夫过程 使图形构建变为有序的随机演化过程 避免无效重复尝试 [2] - 团队引入“规范化表示”技术 能自动识别合并对称或同构的拓扑结构 将庞杂搜索空间压缩几个数量级 解决了“路径爆炸”难题 [2] - 系统通过价值函数模拟人类的数学审美来寻找解题“灵感” [2] 性能与效率对比 - 相比谷歌DeepMind的AlphaGeometry依赖大规模离线合成数据和庞大计算资源 “通矩模型”实现了“小数据、大任务”的范式转换 [2][3] - “通矩模型”仅需一张普通国产消费级显卡 即可在最多38分钟内解决近25年来所有国际数学奥林匹克竞赛的几何难题 [3] - AlphaGeometry主要依赖于大规模离线合成数据和庞大的计算资源 [2] 应用成果与影响 - 由“通矩模型”自主生成的3道几何新题已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛 这是AI原创题目首次进入高规格人类数学竞赛 [3] - 该成果体现了我国在通用人工智能基础研究领域“学—研—产”深度融合的正向研发优势 [3] - 未来团队将继续沿“小数据 大任务”的研究范式拓展通用人工智能模型 [3]
38分钟内即可解决近25年所有奥数几何难题 人工智能逻辑推理技术获突破
科技日报· 2026-01-28 09:56
技术突破与核心能力 - 中国科研团队开发出全球首个同时具备自主出题和自动解题双重能力的通用人工智能系统“通矩模型”(TongGeometry)[1] - 该系统实现了从“模仿解题”到“自主创造”的范式转变 能精准捕捉具备人类数学家审美标准的高质量题目[1] - 其自主生成的3道几何新题已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛[1] 性能与效率优势 - 相比DeepMind的AlphaGeometry需要庞大算力集群 TongGeometry仅需单张消费级显卡即可在最多38分钟内解决近25年所有的奥数几何难题[2] - 该系统不依赖海量标注数据 通过内部逻辑自我演化 在理解逻辑底层美学和自主发现科学规律方面走在前列[2] 行业地位与意义 - 该成果标志着在自动化推理的逻辑核心领域实现关键技术自研 并在性能与功能多样性上全面超越以DeepMind为代表的国际顶尖水平[2] - 这种发展路径被认为是通用人工智能(AGI)发展的关键[2]
人工智能逻辑推理技术获突破
科技日报· 2026-01-28 09:19
文章核心观点 - 中国科研团队开发出全球首个兼具自主出题与自动解题能力的通用人工智能系统“通矩模型”(TongGeometry),实现了从“模仿解题”到“自主创造”的范式转变,并在性能与功能多样性上全面超越以DeepMind的AlphaGeometry为代表的国际顶尖水平 [1][2] 技术突破与能力 - 系统具备“出题”与“解题”双重能力,不仅能像“优等生”一样满分解题,更能像“出题名师”一样创造优美、新颖的题目 [1] - 其自主生成的3道几何新题已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛 [1] - 系统能从浩如烟海的空间组合中,精准捕捉具备人类数学家审美标准的高质量题目 [1] 性能与效率优势 - 相比AlphaGeometry需要庞大的算力集群,TongGeometry仅需单张消费级显卡即可运行 [2] - 该系统能在最多38分钟内,解决近25年所有的奥数几何难题 [2] 技术路径与行业意义 - 该系统不依赖海量标注数据,通过内部逻辑自我演化,是通用人工智能(AGI)发展的关键路径 [2] - 中国科研团队在自动化推理的逻辑核心领域实现了关键技术自研 [2] - 系统在理解逻辑底层美学和自主发现科学规律方面走在了前列 [2]
全球首个!国产AI出的题被收入高规格人类数学竞赛
环球网资讯· 2026-01-27 10:01
核心观点 - 中国科研团队开发出全球首个同时具备自主出题和自动解题双重能力的通用人工智能系统“通矩模型”,实现了从“模仿解题”到“自主创造”的范式转变 [1] 技术能力与创新 - 系统不仅能够自动解题,更能从海量空间组合中精准捕捉符合人类数学家审美标准的高质量题目,自主创造新颖几何题 [1] - 通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题 [2] - 相比需要庞大算力集群的AlphaGeometry,该系统仅需单张消费级显卡即可在最多38分钟内解决近25年所有的奥数几何难题,推理效率和准确率达到世界顶尖水平 [2] 性能表现与认可 - 系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛及美国精英奥赛,这是AI原创题目首次进入高规格人类数学竞赛 [2] - 该成果标志着在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平 [2]
我国在通用人工智能逻辑推理领域实现重大跨越
环球网资讯· 2026-01-27 09:41
核心观点 - 中国科研团队开发出全球首个兼具自主出题与自动解题双重能力的通用人工智能系统“通矩模型”(TongGeometry),在逻辑推理领域实现了从“模仿解题”到“自主创造”的范式转变,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平 [1][5] 技术突破与性能表现 - 系统核心能力在于对偶性建模,能够从海量空间组合中精准捕捉符合人类数学家审美标准的高质量奥赛题目,实现了自主创造 [2] - 相比需要庞大算力集群的AlphaGeometry,该系统仅需单张消费级显卡(如RTX 4090)即可在最多38分钟内解决近25年所有奥数几何难题,推理效率和准确率均达世界顶尖水平 [2] - 系统通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题 [2] - 系统实现了“小数据、大任务”的范式转化,不依赖海量标注数据,通过模拟人类数学家的直觉和审美进行内部逻辑自我演化 [4] 行业影响与认可 - 系统自主生成的3道几何新题已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛,这是AI原创题目首次进入高规格人类数学竞赛 [5] - 该成果标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研 [5] - 该科研团队由北京通用人工智能研究院、北京大学多个学院及研究院联合组成,未来将继续深耕“通系列”通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑 [5]
思考已成白菜价?黄仁勋一语成谶,物理学家:人类科研只剩3年
36氪· 2026-01-16 16:44
AI对科研行业的颠覆性影响 - 德国物理学家Sabine Hossenfelder预测,3年内当前形式的科学研究将不复存在,AI将以极低成本替代学生和博士后完成的工作[1][2] - AI能力的进化速度远超预期,英伟达CEO黄仁勋提出“智能即将成为一种商品”,冲击以科学家为代表的脑力工作者[3] - 科研机构将面临成本抉择:用高昂薪水聘请研究人员花费数月计算,还是支付零头成本让AI在几秒钟内搞定[7] AI驱动科研效率的跃升 - 大模型采用可极大提高研究者产出,让论文产出平均增加40%,对非英语母语者增幅甚至达到80%[11] - 一旦研究者看到前沿模型能帮助产出更多论文,采用率预计将飙升至接近100%,覆盖几乎所有科学学科[11] - 顶尖科学家如菲尔兹奖得主陶哲轩已积极拥抱AI工具,利用其进行证明思路寻找、头脑风暴和参考文献查找[12] 国家与科技巨头的战略布局 - 美国政府于2025年末启动“创世纪任务”,旨在利用AI加速科学发现,能源部下属17个国家实验室将打造一体化AI驱动平台[14][15][16] - Google DeepMind已同意向国家实验室的科学家提供其前沿AI工具的早期使用权限[17] - OpenAI通过“NextGenAI”项目承诺投入5000万美元,为麻省理工、牛津等15所顶尖机构提供研究经费、算力和前沿模型访问[18] 科研范式与行业结构重塑 - AI将首先颠覆理论物理、数学等高度依赖编程和计算的领域,传统科研体系中依赖“计算”和“执行”的岗位可能在3年内迎来终局[6][8] - 拥有顶级AI资源的机构将与普通机构拉开难以逾越的鸿沟,导致科研阶层分化[19] - 初级科研岗位面临较大冲击,研究生承担的文献整理、代码编写、基础计算工作可能被AI更快更好地完成,传统“学徒制”培养模式面临失效[25] 学术生态系统的变化 - AI导致“论文通胀”已不可避免,论文数量暴增可能导致没有足够人力进行评审[11] - 据Frontiers调查,53%的同行评审者承认使用了AI,未来可能进入“AI写论文、AI审论文”的闭环[22] - 当学术生产过程变成机器与机器的对话,人类在其中的信誉和价值将被稀释[24] AI在具体科学领域的应用进展 - Google DeepMind的AlphaGeometry将大模型与符号求解器结合,攻克高难度几何证明问题[23] - Anthropic推出的Claude for Life Sciences通过深度微调,协助诺和诺德、赛诺菲等大型药企加速药物研发[23] - 从MIT、牛津大学等顶尖学府为全体师生采购基于ChatGPT的校园版服务,可见AI对学术研究领域的渗透[8] 未来科学家角色的转变 - 科学家需从“知识的搬运工”进化为“智慧的指挥官”,核心价值在于提出好问题的能力、跨学科的宏观视野以及品味与判断力[25] - AI将把科学家从枯燥、重复的“脑力流水线”中解放出来,使其有精力攻克癌症、气候变暖、可控核聚变等人类长期未能解决的难题[25] - 人类需要成为自己的“风险准备负责人”,应对AI可能带来的危险、自主或快速演化能力的前沿系统[5][26]
Nature重磅发文:深度学习x符号学习,是AGI唯一路径
36氪· 2025-12-17 10:12
行业技术发展路径 - 当前以神经网络(尤其是大模型)为主导的AI范式在实现类人智能方面被认为存在根本性局限,绝大多数研究者认为仅靠神经网络无法实现人类级智能(AGI)[1] - 行业探索的新方向是神经-符号融合(Neurosymbolic AI),即将基于规则逻辑的符号派AI与基于数据学习的神经网络相结合,这被视为打破单一神经网络话语权、通往AGI的潜在突破路径[2][5] - 神经-符号融合不仅旨在追求通用智能的长期目标,更着眼于在军事、医疗等高可靠性要求场景中,提供人类可理解、可追溯的智能形态[7] 符号AI的复兴与价值 - 符号派AI历史上曾为主流,其核心是相信世界可以用精确的规则、逻辑和概念关系来刻画[3] - 随着神经网络凭借数据驱动范式崛起,符号系统一度被边缘化,但自2021年左右起,神经-符号融合研究急速升温,符号AI价值被重新评估[5] - 符号系统的优势在于其运作机制清晰、擅长逻辑推理,并能将通用知识应用于全新情境,但其弱点在于难以处理模糊概念(如人类语言),且构建庞大规则库难度大、搜索速度慢[19] 神经网络的优势与局限 - 神经网络通过多层节点调整权重从数据中学习模式,其优势是速度快、富有创造力,但缺陷是会产生“幻觉”编造内容,且对于超出训练数据范围的问题无法可靠回答[19] - 缺乏符号知识导致神经网络会犯低级错误,例如生成有六根手指的人像,因为它没有掌握“手通常有五根手指”这一通用概念[16] - 部分研究者认为,这些错误揭示了神经网络在泛化知识和逻辑推理方面存在根本性能力不足,而不仅是缺乏数据或算力的问题[18] 技术融合的实践与挑战 - 已有代表性的神经符号AI系统问世,例如DeepMind的AlphaGeometry能稳定解出国际数学奥林匹克竞赛(IMO)级别题目[7] - 主流技术路径之一是**用符号技术加持神经网络**:例如AlphaGeometry先用符号编程生成海量数学题作为合成数据,再训练神经网络,使解题过程可验证且错误率极低[33][35] - 另一条路径是**用神经网络辅助符号算法**:利用神经网络预测方向以大幅修剪符号系统庞大的搜索空间,例如AlphaGo通过神经网络预测高胜率落子,从而在约10^170种可能性的围棋搜索树中快速锁定最佳走法[37] - 然而,将两者深度融合成通用“全能AI”仍极其棘手,系统架构复杂,被形容为设计一个“双头怪物”[7] 行业观点分歧 - 支持纯神经网络路径的观点以Richard Sutton的《苦涩的教训》为代表,认为利用海量数据和算力进行搜索与学习的系统反复战胜了依赖人类设计规则的符号方法,例如早期国际象棋程序败给数据驱动系统[9][10] - 神经网络支持者引用该观点,主张将系统做得更大是通往AGI的最佳路径[13] - 但许多研究人员认为该观点言过其实,低估了符号系统的关键作用,并指出当今最强国际象棋程序Stockfish正是结合了神经网络与符号树[13] - 神经符号融合的支持者(如Gary Marcus)认为,这可能是向AI注入逻辑推理的最佳甚至唯一方法,IBM等科技巨头也正押注该技术[18] - 反对融合的观点依然存在,例如Yann LeCun曾表示神经符号方法与深度学习机制“不兼容”[21],而Richard Sutton坚持认为“苦涩的教训”至今仍适用[22] - 也有务实派(如MIT的Leslie Kaelbling)认为争论哪种观点正确无益,应专注于任何行之有效的方法[26]
AI for Science,走到哪一步了?
36氪· 2025-12-03 17:15
科学智能技术演进与谷歌DeepMind引领作用 - 谷歌DeepMind凭借以TPU为核心的AI算力基础设施和以Gemini为基础的大模型底座,持续深耕科学智能技术超过十年,引领全球技术演进[4] - AlphaFold标志着蛋白质结构预测问题的实质性解决,不仅斩获2024年诺贝尔化学奖,更成为现代生物学的数字基础设施[4] - AlphaProteo推动生物学研究正式跨入生成式生物学时代,结合AlphaMissense精准预测基因突变致病性,打通"靶点发现—结构解析—药物设计"全链路[4] - WeatherNext 2模型在99.9%的预测变量与时间跨度上准确率均优于欧洲中期天气预报中心的HRES系统,且推理速度提升了数个数量级[5] - GNoME预测了数百万种稳定的新材料结构,规模相当于人类过去几十年实验发现总和的数倍,为电池技术与超导材料研发提供庞大候选库[5] - AlphaEvolve引入进化计算范式,自动搜索发现更高效的机器学习算法与损失函数,实现从"人工设计"到"自动发现"的元层级跨越[6] 生物学领域科学智能突破 - 谷歌和耶鲁大学联合发布270亿参数单细胞分析基础模型C2S-Scale,生成关于癌细胞行为的全新假设并在体外实验中得到验证[8] - 微软BioEmu模型在蛋白质动力学模拟方面实现高达10万倍的模拟速度提升,中科院团队提出整合结构和进化约束的反向折叠蛋白质预测模型[9] - 谷歌通过10年持续研发构建了从基因测序、读取到疾病基因检测和诊断的AI基因组学研究和应用体系[9] - 腾讯DeepGEM病理大模型只需常规病例切片图像即可在1分钟内完成肺癌基因突变预测,精准度达78%至99%[10] - 谷歌发布DeepSomatic工具集用于肿瘤细胞基因变异识别,适用于白血病、乳腺癌、肺癌等癌症类型[10] - AI优化候选药物MTS-004已完成III期临床研究,成为国内首款完成III期临床的AI赋能制剂新药,突破过去几年AI驱动药物发现鲜有突破临床II期的瓶颈[10] 多学科科学智能应用拓展 - Periodic Labs开展新型超导材料等AI自动化发现,CuspAI获1亿美元A轮融资研发AI平台用于发现碳捕获新材料[11] - DeepMind飓风AI模型成功预测"梅利莎"等超强飓风路径和强度变化,黑洞理论物理学家利用GPT-5在半小时内推导出黑洞理论新特性[11] - 数学研究人员利用GPT5探索解决历史数学难题埃尔德什难题,英伟达开源模型系统GenCluster获得IOI 2025竞赛金奖[12] - OpenAI内部模型、Gemini Deep Think和DeepSeek Math-V2等大模型不断刷新AI在奥林匹克数学竞赛的金奖成绩[12] 科学智能科研范式重构 - 通用基础大模型成为科学智能的"操作系统",提供强大理解、推理、分析及生成能力,帮助科研人员大幅提升日常科研效率[14] - 科研专用大模型作为垂直科研领域的"专用引擎",融合特定领域相关知识以及研究方法与经验,谷歌在此方面综合实力处于全球领先[14] - AI智能体从被动工具转变为科学家的合作者甚至主动发现者,ToolUniverse平台包含超过600个科学工具并兼容主流基础大模型[15] - AlphaEvolve是具有编码能力的进化型AI智能体,可进行数学和计算通用算法的主动发现和自动化优化,已应用于谷歌内部实际场景[15] 自主实验室平台化发展 - MIT等美国多家科研高校和国家实验室已建成自主实验室,英国利物浦大学的材料创新工厂是欧洲最先进的自主实验室之一[16] - 美国《创世使命》计划将科研算力、AI基础模型、数据集及自主实验室体系集成为科学与安全平台,作为科研智能基础设施[16] - 晶泰科技的AI+机器人平台已成为核心竞争力,中科院"ChemBrain智能体+ChemBody机器人"和北京科学智能研究院Uni-Lab-OS加速推动国内自主实验室研发[17] - 磐石·科学基础大模型实现对数据和模型等资源的管理及科研工具调度,已在生命科学、高能物理和力学研究领域进行应用[17]
国际最新研发一AI系统:能证明复杂数学理论
中国新闻网· 2025-11-13 11:57
核心观点 - 谷歌旗下DeepMind研发的AI系统AlphaProof能够证明复杂的数学理论,并通过自动验证的推理过程克服大语言模型在数学推理正确性验证方面的挑战 [1] - AlphaProof在2024年国际数学奥林匹克竞赛中联合AlphaGeometry系统,解出6个问题中的4个,取得相当于银牌水平的高分 [2] 技术突破 - 研究团队演示了如何让增强学习在正式数学软件环境中工作,从而生成推理过程能被自动验证的证明 [1] - AlphaProof为证明数学命题而设计,在对8000万个命题进行自动形式化后,通过增强学习找出证明方法 [1] - 该系统被证明能提升之前先进AI系统在既往数学竞赛问题上的结果 [1] 应用表现 - 在权威的高中水平数学竞赛中,AlphaProof联合AlphaGeometry系统解出6个竞赛问题中的4个 [2] - 该系统在竞赛级数学推理领域的表现令人惊艳 [2] 发展前景 - 专家指出AlphaProof在求解其他形式难题上还存在一些局限性,建议作为未来的研究方向 [2] - 克服这些局限将使AlphaProof成为一个重要的复杂数学问题解题工具 [2]