清华学霸与AI比做高考压轴题,谁会赢?
大模型理科能力提升 - 网易有道发布视频显示6位清华姚班学生与AI比赛做高考压轴题 姚班学生在10分钟内完成作答且仅1位做错 AI答疑笔在输入确认后几秒输出步骤并答对题目 [1] - 姚班学生认为AI做题思路与其一致 步骤更清晰 更有利于学生理解解题思路 [1] - 去年高考测试显示9家大模型中4家文科达到河南一本线 但无大模型理科达到一本线 今年AI在北京高考二模测试中获697分(总分750) 达"清北"水平 [2] 行业技术进展 - DeepSeek-R1带来推理模型大爆发 大模型推理和交互能力在教育场景适配性高 逐步解决个性化教学和答疑需求 [2] - OpenAI o3-mini在FrontierMath基准测试中首次尝试解决超过32%问题 包括28%挑战性(T3)问题 FrontierMath问题对专业数学家需数小时至数日解决 [3] - 谷歌AlphaProof和AlphaGeometry 2解决2024年IMO六题中的四题 达到银牌得主水平 [3] - 阿里巴巴Qwen3在AIME25测评中获81.5分 刷新开源纪录 [3] 市场前景 - 艾媒咨询报告指出2023至2027年在线教育市场AI贡献率预计从7%提升至16% [3]