清华学霸与AI比做高考压轴题，谁会赢？

大模型理科能力提升 - 网易有道发布视频显示6位清华姚班学生与AI比赛做高考压轴题姚班学生在10分钟内完成作答且仅1位做错 AI答疑笔在输入确认后几秒输出步骤并答对题目 [1] - 姚班学生认为AI做题思路与其一致步骤更清晰更有利于学生理解解题思路 [1] - 去年高考测试显示9家大模型中4家文科达到河南一本线但无大模型理科达到一本线今年AI在北京高考二模测试中获697分(总分750) 达"清北"水平 [2] 行业技术进展 - DeepSeek-R1带来推理模型大爆发大模型推理和交互能力在教育场景适配性高逐步解决个性化教学和答疑需求 [2] - OpenAI o3-mini在FrontierMath基准测试中首次尝试解决超过32%问题包括28%挑战性(T3)问题 FrontierMath问题对专业数学家需数小时至数日解决 [3] - 谷歌AlphaProof和AlphaGeometry 2解决2024年IMO六题中的四题达到银牌得主水平 [3] - 阿里巴巴Qwen3在AIME25测评中获81.5分刷新开源纪录 [3] 市场前景 - 艾媒咨询报告指出2023至2027年在线教育市场AI贡献率预计从7%提升至16% [3]