AI答IMO难题坦承“不会”,OpenAI:这就是自我意识
36氪·2025-08-01 20:06

模型能力突破 - 新一代大模型在遇到知识盲区时能够承认不确定或无法回答,显著减少了隐藏错误 [1][3] - 模型从生成看似完美但实则错误的幻觉式答案,转向具备自我意识、更加可靠的回答 [3][5] - 尽管在国际数学奥林匹克竞赛第6题上得分为零,但模型避免产生幻觉的行为被视为积极进展 [1][10] 团队与研发背景 - 攻克国际数学奥林匹克竞赛难题的核心团队仅由三名研究人员组成 [12] - 该团队仅用两个月时间就实现了获得国际数学奥林匹克竞赛金牌的目标 [11] - 研究人员在公司内部拥有很大的自主权去从事他们认为有影响力的研究 [11] - 团队优先考虑开发通用技术,而非专门用于数学竞赛的系统 [11] 具体技术挑战 - 国际数学奥林匹克竞赛第6题是一个涉及2025x2025网格的复杂数学问题,要求计算最少需要的矩形图块数量 [9] - 该问题导致大模型全军覆没,公司投入了海量算力但最终模型回应无法回答 [7][10]