Workflow
icon
搜索文档
上海“绕口令”高考作文题为何引热议
中国青年报· 2025-06-12 06:26
上海高考作文题引发社会热议 - 2024年上海高考作文题以"专、转、传"为核心概念,要求考生讨论从专业文章到传世佳作是否必须经过通俗化传播阶段,该话题登上微博热搜榜首[1] - 题目灵感源自华东师范大学胡晓明教授的文章《古人说"文章九命"》,其将文章命运归纳为"专、转、传"三个阶段[1][4] 考生与教师反馈 - 上海南洋模范中学理科生小林反映题目抽象,初期将"传"误解为"传记",需反复阅读题干[2] - 考生普遍认为举例困难,因缺乏专业学术文章的阅读经验,但最终完成率较高[2] - 对比近5年上海高考作文题(如2023年"好奇心"、2022年"问题与结论"),今年题干长度和抽象程度显著提升[3] 专家观点分歧 支持方 - 胡晓明教授认为题干长度有助于理解关键点,核心在于"转"字,反映社交媒体时代信息传播特征[4] - 华中科技大学曹林教授赞赏题目具有"现实辨析价值",能激发思辨空间[8] - 北京市特级教师肖远骑指出题目延续上海卷风格,侧重考察思想深度与判断能力[7] 质疑方 - 特级教师李强批评命题"人人猜不到但非人人能写",专业/通俗/传世文章概念并列易致混淆[5] - 姚为洲指出题目存在逻辑矛盾:前半段分类文章类型,后半段讨论文章发展阶段,与原文立意偏离[5] 教育实践调整 - 上海某中学计划在语文课程中增加社会热点思辨训练,引入文科经典论文以提升学生独立思考能力[8] - 教研组拟联动初高中教学方案,强化多维度分析问题的教学导向[8] 对中考的影响 - 专家建议中考生面对难题需保持心态稳定,家长罗女士已针对性收集时事素材与国家发展类文章[7] - 李强强调中考作文应注重基础写作能力而非过度追求抽象命题[7]
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
AI模型高考作文表现 - 2025年九大AI模型高考作文测评显示,谷歌Gemini和DeepSeek以61.5分并列第一,元宝(61分)、通义千问(59.75分)、Kimi(59.5分)紧随其后,豆包(59分)、文心一言(58.5分)表现中等,智谱清言(50.75分)和ChatGPT(50.5分)垫底 [3][4][20][28][36][46][62][70][80][92][94] - 新晋模型Gemini和DeepSeek首次参评即登顶,去年前三名通义千问、元宝、豆包排名下滑至第三、第四和第六位 [3][4] - 测评采用上海卷思辨性作文题目,AI在逻辑明确的任务中表现更优;全国一卷诗歌类题目则普遍审题不清 [6][7] AI作文能力进步与局限 - 教师评价AI作文语言规范、材料丰富、逻辑性强,审题准确且结构程式化,但缺乏个性化思考和情感共鸣 [97][98][99] - 相比2024年,AI在情感表达和思想深度上有进步,但仍存在案例堆砌、逻辑错误和"论文味过重"问题 [1][2][99] - 高分作文如Gemini和DeepSeek的共性:论点鲜明、论据充实(引用爱因斯坦相对论、马尔克斯《百年孤独》等),结构完整且扣题紧密 [20][28] 头部模型厂商格局变化 - 测评覆盖国内外头部厂商,包括谷歌、DeepSeek、腾讯(元宝)、阿里(通义千问)、字节(豆包)、百度(文心一言)、月之暗面(Kimi)、智谱和OpenAI(ChatGPT) [5] - 谷歌Gemini和DeepSeek凭借技术迭代迅速崛起,成为新头部;国内厂商中腾讯元宝稳定性较强,阿里通义千问和字节豆包排名波动较大 [3][4][36][46] - 智谱清言和ChatGPT因内容生硬、分析浅显垫底,反映部分厂商在语言理解和逻辑构建上的技术短板 [92][94][96] 作文内容与评分细节 - 高分作文典型结构:Gemini采用"点题-关系阐述-正反论证-结论"框架,DeepSeek通过历史典故(孔子、钱锺书)强化思辨 [20][24][28] - 评分差异体现教师偏好:元宝获左建国最高分(63分)但文旭仅给52分,通义千问获文旭和许珊68分高分但左建国仅评51分 [36][46] - AI仍存在事实错误(如将黄庭坚诗句误标为苏轼),显示幻觉问题未完全解决 [47]
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]