严谨

搜索文档
记者手记:心有坚守 逐梦太空
新华社· 2025-07-15 18:27
新华社海南文昌7月15日电 记者手记:心有坚守 逐梦太空 新华社记者宋晨、陈凯姿 15日凌晨,天舟九号货运飞船在我国文昌航天发射场成功发射。每一次航天任务都离不开"万人一杆 枪"的协作。发射成功的背后,有这样一群航天人的"坚守",令人动容。 当长征七号遥十运载火箭的烈焰喷腾而出,观礼人群的欢呼声此起彼伏,中国航天科技集团八院丁同才 正全神贯注地盯着电脑屏幕上的数据曲线。"以首发的心态看待每一次任务,这是我们试验队始终坚守 的信念。每一次任务都是新的挑战,每一次出发都是新的征程。" 翁沈天用亲身经历告诫新人:小到一根保险丝的检查、一句口令的反复纠错、一个简单操作的重复练 习,都要熟记于心。 航天精神最生动的诠释,体现在每一位航天人"追求极致"的严谨中。 "哪怕出现微小偏差,都意味着整个流程要重新验证,一个参数异常就可能需要彻夜进行技术追溯。"中 国航天科技集团八院刘少华得知自己将加入试验队,能够把参与测试的型号发射升空,自豪之余更多的 是强烈的使命感。那些枯燥的重复确认、繁琐的交叉复核,正是大家共同用汗水浇筑起来的"质量长 城"。 如果说严谨是中国航天接连成功的"法宝",创新则是不断取得突破的不竭动力。 在此次 ...
大模型为何难成为「数学家」?斯坦福等揭示严谨证明中的结构性弱点
机器之心· 2025-06-22 12:26
数学推理与AI研究 - 数学证明需要逻辑闭合和严谨推理过程,不等式问题是检验模型推理能力的理想对象[1] - 当前形式化数学系统如Lean、Coq要求极高精度,难以规模化应用于中学到奥数级别的不等式问题[1] - 大语言模型在非形式化推理方面表现出色,能给出看似合理的答案并模仿人类初期思维方式[1] IneqMath创新方法 - 研究团队提出将不等式证明拆解为"界限估计"和"关系预测"两个子任务[2][7] - 构建首个奥林匹克级不等式证明基准数据集IneqMath,包含1,252道训练题目和200道测试题目[11][12] - 数据集覆盖83种定理和29个定理类别,测试集由IMO奖牌得主设计并经数学家审核[12] 评估框架 - 开发LLM-as-Judge框架,包含五种自动评审器评估模型推理严谨性[20] - 评审器系统在与人工标注对齐的任务上达到F1=0.93的表现[24] - 框架可判断模型是"碰巧答对"还是每个推理节点都正确[23] 研究发现 - 存在Soundness Gap现象:模型最终答案准确率与推理严谨性差距显著[27] - Grok 3 mini最终答案准确率71.5%,但逐步评审后骤降至6.0%[29] - 模型规模增大能提升猜测准确率,但对推理严谨性提升有限[30] - 增加推理token数仅带来轻微提升,很快进入饱和状态[32] 改进策略 - 自我批判提升策略为Gemini 2.5 Pro带来约5%的准确率提升[42] - 定理提示策略使Gemini 2.5 Pro准确率提升约10%[42] - 研究团队设立动态更新的排行榜推动模型在严谨数学推理上的进步[36] 研究团队 - 项目由斯坦福大学、麻省理工学院和加州大学伯克利分校的研究者联合完成[44] - 负责人Pan Lu是斯坦福大学博士后研究员,研究方向包括大语言模型和数学发现[45] - 合作者包括MIT博士生Alex Gu和斯坦福大学博士生Jikai Jin[46][47]
苏轼景点释义、配图有误?惠州文广旅体局回应
南方都市报· 2025-06-09 15:56
6月7日,有网友在社交平台发帖@惠州文旅,指出合江楼景点内苏轼诗句中的"蓬莱方丈"释义存在错误,呼吁尽快修正。记者从惠州市文化广电旅游体育局 了解到,该局已收到反馈,有关部门正在更改中。 网友:"蓬莱方丈"释义存误,实为仙山代称而非特定人物 网友指出,苏轼《寓居合江楼》诗句"蓬莱方丈应不远,肯为苏子浮江来"中的"蓬莱方丈",本意指蓬莱、方丈两座海上仙山。然而,景点介绍牌却将其解释 为"蓬莱仙山修炼的方丈",并据此翻译:"那蓬莱仙山修炼的方丈……一定会浮江而来,与我一醉方休。" 该网友同时呼吁,希望惠州文旅看到之后,组织人员修正,毕竟这是颇具影响力的景点。 6月8日,记者在合江楼二层平台东侧找到涉事介绍牌,截至当日18时,该牌仍维持原状,尚未启动修正处理。 除了释义问题外,有网友指出,原诗首句"海山葱昽气佳哉"用字也存在争议。记者查阅中华书局2021年版《苏东坡全集》,书上用的是"葱昽",而非景点介 绍牌上的"葱茏"。 仿佛曾游岂梦中,欣然邓 相携迎此豹。 赤武岂知还漠士 ,自注:岭南万户酒。会有幽人 窩屋 7D 11 - 11 - 海山葱成气佳哉,二江合 *子浮江来。江风初凉睡正美 违,西流白日东流水。楼中老 ...
【科技日报】彭桓武:专门写纸条请年轻人为自己的论文把关
科技日报· 2025-06-06 09:09
人物背景 - 彭桓武是中国著名理论物理学家,1955年当选为中国科学院学部委员(院士),对中国第一代原子弹和氢弹的研究和理论设计作出重要贡献 [2] - 彭桓武曾获1982年国家自然科学奖一等奖、1985年国家科技进步奖特等奖、1995年何梁何利基金科学与技术成就奖、1999年"两弹一星功勋奖章" [2] 学术交流事件 - 1992年孙昌璞博士毕业后在杨振宁指导下进行博士后研究,发现彭桓武关于量子布朗运动的论文存在错误 [2] - 在杨振宁鼓励下,孙昌璞写信指出彭桓武论文中的问题 [2] - 彭桓武邀请孙昌璞到中国科学院理论物理研究所就此问题作学术报告,并承认论文错误 [3] - 彭桓武表示错误责任主要在自己,但也指出审稿人因他是名人而没有严格审稿 [3] 学术态度 - 彭桓武请孙昌璞对他未来的量子力学相关论文继续把关,体现对科学真理的尊重和科研严谨性的坚持 [3] - 该事件展现了科学进步需要勇气承认不足并通过修正接近真理 [3] - 杨振宁鼓励孙昌璞指出权威错误,体现"学术不应有等级高低之分,真理面前人人平等"的理念 [2]