国产大模型高考表现 - DeepSeek R1以143分成为国产大模型数学科目状元,讯飞星火X1以141分紧随其后,两者在函数题、数列证明等高难度题型中均展现完整解题链[9] - 数学实测显示DeepSeek R1在128K上下文优势明显,复杂题目分步推导无遗漏,但存在OCR识别短板需人工转写题目[10] - 不同评测机构结果存在差异:IT之家测试中DeepSeek数学143分第一,而自媒体"数字生命卡兹克"评测中其得分64.3分低于讯飞星火X1和豆包1.5[9][11][12] 语文作文能力对比 - 讯飞星火X1作文《以歌为刃破长夜且将热血铸山河》获52/54高分,专家评价其结构如交响乐章,选材如历史长卷,构建从个体觉醒到文明永续的逻辑链[2] - DeepSeek《悲歌当泣》采用六段式结构层层递进探讨艺术作用,获52.5分但被指敦煌案例"缺乏现代表达"[4][6] - 文心一言因过度抒情跌至47分垫底,豆包1244字超长作文因"沉默与发声辩证不足"扣分[6] 英语作文跨文化表达 - 讯飞星火X1英语作文以19.5平均分夺冠,其"全球气候行动网络"提案内容完整且句式多样,展现对国际议题精准理解[13][14] - DeepSeek R1英语作文结构严谨逻辑流畅但UN initiatives翻译不够具体,ChatGPT o3因口语化表达和腾讯混元T1因非正式语体得分较低[16] 技术路线与行业格局 - 全国产算力下70B量级的讯飞星火凭借算法优化与教育领域深耕,超越更大参数规模对手[1] - 深度推理大模型执行"解析题干-提炼论点-匹配论据"流程,可成为学生写作思考链条,启发突破套路化表达[18] - 国产大模型推理能力实现质的飞跃,讯飞星火等多家模型高考数学成绩突破130分[18]
大模型高考成绩单出炉,讯飞星火语数外实力位居第一梯队
和讯网·2025-06-09 17:05