AlphaGeometry

搜索文档
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
量子位· 2025-05-31 11:34
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源 形式化数学猜想库 —— 猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。 DeepMind的形式化数学猜想库一经建成,团队就表示所有人都可以将数学猜想添加到资源库中,呼吁大家积极参与。 感兴趣的数学家们可以行动起来了。 陶哲轩曾用Lean形式化证明了PFR猜想(多项式Freiman-Ruzsa猜想),这项成就的第一步就是将猜想的核心概念转化为计算机可验证的形 式化版本。 目前,这位"数学界的计算机推广大神"已转发此项目,并表示: "如果希望利用自动化工具帮助开放性问题,那么对这些问题进行形式化表述是重要的第一步。" 形式化数学猜想库有什么用 虽然带证明的形式化定理语料库不断扩充,但仅陈述开放式猜想的形式化资源却十分稀缺。 这类资源有望成为自动定理证明或形式化工具的测试基准,来帮助AI模型提升数学推理及证明能力。 DeepMind此次开源的猜想库在一定程度上缓解了这个问题 ...
清华学霸与AI比做高考压轴题,谁会赢?
第一财经· 2025-05-27 19:17
姚班学生在10分钟内完成了作答,仅有1位同学做错了题目,AI答疑笔则在输入确认后几秒就开始输出步骤。 去年,"9.11和9.9谁大?"这一简单的数学题曾难倒了多家大模型。到了今年,大模型的理科能力提升如何? 今日网易有道发布了一则视频,6位清华姚班学生与AI比赛做高考压轴题。清华姚班为图灵奖得主姚期智院士创办,汇聚了数学、物理、信息学竞赛金牌得 主。 姚班学生和AI竞速的两道题分别为2023年高考数学全国一卷压轴题和2021年高考物理江苏卷压轴题。姚班学生在10分钟内完成了作答,仅有1位同学做错了 题目,AI答疑笔则在输入确认后几秒就开始输出步骤,并答对了题目。 对于AI的回答,一位姚班学生认为AI做题思路与其一致,步骤更加清晰,相较于传统的答案更有利于学生理解解题思路。 ## 1 Introduction The _Front_ of the Universe is a very important tool in the study of the evolution of the Universe. The Universe is a very rich and rich and rich and ric ...
技术伦理的断裂带:当AI信任超越人类控制
虎嗅· 2025-05-10 18:55
智能驾驶事故分析 - 小米SU7以97公里时速撞向水泥护栏 事故暴露智能汽车安全性问题 车内三名大学生遇难[1] - 小米SU7标准版为降低成本移除激光雷达 纯视觉系统在车速超过85km/h时有效检测距离不足200米 应急反应时间仅7秒左右 低于行业安全阈值[2] - 智能汽车行业存在"标准套利"现象 企业利用监管滞后性选择宽松标准规避技术责任 在安全与成本间做出不利于长期用户安全的权衡[3] 航空业与智能驾驶监管对比 - 波音787飞控系统需通过FAA 300+项专项认证 飞行员转型培训标准为28天全沉浸式课程 含56小时模拟器训练[2] - 美国NHTSA自2016年推出自动驾驶框架 但未对L4+系统建立强制性认证标准 远低于航空业FAA严格标准[3] - 特斯拉Autopilot十年5次架构革新 但未对驾驶员提出培训要求 与航空业严格培训形成鲜明对比[3] 技术伦理与治理挑战 - 克隆技术治理迅速且严格 美国1997年禁止联邦资金用于人类克隆研究 欧洲1998年通过《欧洲人权与生物医学公约》附加议定书禁止生殖性克隆[5] - AI伦理治理严重滞后 DeepMind AlphaGeometry模型训练数据伦理争议无人问责 自动驾驶"电车难题"争论十余年仍无统一责任框架[7] - AI风险如无色无味气体 难以察觉但可能造成灾难性后果 需建立类似克隆技术的全球治理框架[8] 智能驾驶行业治理建议 - 应建立分级风险评估机制 对高风险应用实施差异化监管 引入"伦理黑匣子"记录决策过程 进行全生命周期安全审计[9] - 设立伦理激励政策 对合规企业提供税收优惠 构建强制责任保险制度 保费与安全性能挂钩[10] - 需建立超国家AI治理联席机构 在联合国框架内制定《全球人工智能白皮书》实现全球监管协同[10] 行业发展趋势 - 智能驾驶面临监管模式选择 是延续传统汽车渐进式监管 还是借鉴航空业预防性监管体系[4] - 需整合计算机科学 伦理学 法学等多领域专家智慧 共建跨学科全球治理框架[11] - 技术治理"曼哈顿计划"旨在为AI创新提供伦理基础 而非限制发展 人类完全有能力为高风险技术划定边界[11]