高考出分！大模型“考生”，有望冲击“清北”！

大模型高考表现 - 豆包大模型1.6-Thinking版本在2025年山东高考测评中取得文科总分683分、理科总分648分，超过特殊类型招生控制线（521分）和普通类一段线（441分），预估赋分后最高可达690分，排名前80位，达到冲击清华北大的水平 [1][6] - 在文科总分排名中，豆包1.6-Thinking以683分位列第一，领先谷歌Gemini 2.5 Pro（651分）32分；理科总分Gemini 2.5 Pro以655分排名第一，豆包以648分位列第二 [6] - 基础学科表现优异：豆包语文128分、数学141分、英语144分，与其他主流模型（如Gemini数学140分、英语141分）差距较小，显示基础能力趋近人类优秀考生水平 [3][6] 多模态能力对比 - 山东高考试卷中图像类问题占比36%（378分），豆包凭借多模态能力优势显著，而DeepSeek R1因缺乏多模态支持无法正常解答图像题 [6] - 副科赋分优势明显：豆包物理90分、化学100分、地理94分，资深教师预估其赋分后成绩可提升至690分以上，尤其在化学等难度较高科目表现突出 [1][6] 技术迭代与行业应用 - 豆包1.6系列模型技术突破：采用230B总参数稀疏MoE架构，支持256K长上下文推理，新增动态思考能力和多模态融合，在复杂推理、数学竞赛等测试中跻身全球前列 [8] - 大模型产业价值显现：2024年中国AI大模型市场规模294.16亿元，预计2026年突破700亿元，豆包已覆盖4亿终端设备，渗透汽车、金融等八大行业，包括80%主流车企和70%系统重要性银行 [11][12] 高考作为AI评测场景 - 高考成为大模型核心竞技场：题目覆盖文理科全领域及多模态理解，能有效测试模型泛化能力，同时具备社会关注度，推动厂商积极参与测评 [10] - 豆包成绩年增幅显著：相比2024年测评，文科总分提升140.5分（542.5→683），理科提升181.5分（466.5→648），反映技术迭代速度 [11]