AI作文 - 财报，业绩电话会，研报，新闻 - Reportify

AI作文

搜索文档

“有提升”，高考阅卷名师再评AI高考作文：九大模型座次剧烈变动

第一财经· 2025-06-07 22:00

AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评，新增谷歌Gemini和DeepSeek两大头部模型，与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一，元宝61分第三，通义千问59.75分第四，豆包降至第六名59分，ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在：审题准确度、逻辑严密性、材料丰富度，Gemini作文获65分最高单评，引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显：情感表达更自然，思想深度提升，但仍缺乏个性化思考与生命温度，难以产出满分作文[1][4][53] - 技术短板集中体现在：案例堆砌（如智谱清言）、论文腔调（ChatGPT）、结构模板化（Kimi），且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著：思辨类明确题目（上海卷）平均分超60，而开放式诗歌命题（全国一卷）表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒：谷歌Gemini首战登顶，与国产元宝、通义千问形成三强格局，OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起：DeepSeek空降榜首，月之暗面Kimi以59.5分超过百度文心一言（58.5分），显示技术迭代加速[13][32][36] - 测评标准影响排名：同一模型（如豆包）分差达13分（56-69），反映评价体系主观性对结果的影响[20][29]

百度文心一言

百度文心一言