Workflow
清华学霸与AI比做高考压轴题,谁会赢?
第一财经·2025-05-27 19:17

AI大模型理科能力提升 - 清华姚班学生与AI比赛做高考压轴题,姚班学生10分钟内完成作答且仅1人做错,AI答疑笔在几秒内输出步骤并答对题目 [2] - 姚班学生认为AI解题思路与其一致且步骤更清晰,更利于学生理解 [2] - 去年9家大模型尝试河南高考卷,4家文科达一本线但无一家理科达线,今年AI理科能力显著提升 [3] 教育场景AI应用进展 - 有道负责人表示AI推理模型(如DeepSeek-R1)爆发式发展,在教育场景适配性高,可解决个性化教学和答疑需求 [4] - AI挑战北京高考二模新题获697分(总分750分),达"清北"水平,去年同类测试中理科几乎全军覆没 [4] - 2023-2027年在线教育市场AI贡献率预计从7%提升至16% [6] 大模型数学能力突破 - OpenAI o3-mini在FrontierMath基准测试中首次尝试解决超32%问题,包括28%挑战性(T3)问题 [4] - 谷歌AlphaProof和AlphaGeometry 2解决2024年IMO六题中的四题,达银牌得主水平 [5] - 阿里巴巴Qwen3在奥数水平AIME25测评中获81.5分,刷新开源纪录 [6]