Workflow
AI答IMO难题坦承“不会”,OpenAI:这就是自我意识
36氪·2025-08-01 20:06

这一次,"不会"竟成了大模型的高光时刻。 虽然在IMO第6题上得了零分,OpenAI的金牌模型却展现了"高智商的诚实"。 正如OpenAI研究员Noam Brown在最新访谈中所揭示的: 当IMO推理模型会在缺乏有效证据时表示"我不确定",这会显著减少隐藏错误。 在AI摘下IMO金牌后,OpenAI金牌小分队成员Alex Wei、Sheryl Hsu和Noam Brown参与了红杉资本组织的一场对话,揭秘模型攻克精英数学难题的底层 突破。 有网友帮忙总结了个太长不看版: 与过去那些"看起来完美,实则错误"的幻觉式答案不同,这一代大模型开始学会"承认自己不会"。 它标志着模型正在从胡编乱造的幻觉式回答,转向更加可靠且具有"自我认意识"的全新阶段。 三位成员还在这场对话中,分享了更多关于冲刺IMO的有趣细节。 IMO金牌模型能承认自己不知道 尽管数学家与计算机科学家一致认可IMO金牌模型的价值。 但他们常常抱怨,当模型遇到知识盲区时,它总会输出一个令人信服但错误的答案。 他们不得不耗费大量精力逐行验算,才能甄别那些幻觉陷阱。 IMO第6题让大模型全军覆没,当然,OpenAI也对其进行了大量计算。 有一个由2025 ...