Workflow
AI作文
icon
搜索文档
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]