Workflow
对联创作
icon
搜索文档
对联用 AI 写,测完我真是醉了...
36氪· 2026-02-21 09:42
AI大模型内容创作能力评测 - 文章通过设置针对老年人、年轻人、小学生三大群体的春联创作比赛,对ChatGPT、Gemini 3、豆包、Deepseek四款AI大模型在内容生成能力上进行横向评测[3] - 评测设置了三个不同风格要求的赛道:针对老年人的“传统喜庆、稳重典雅”[5];针对年轻人的“新潮朝气、更具网感、更接地气”[14];针对小学生的“童真活泼、简单易懂”[25] - 评测过程不仅包含模型对联生成,还引入了“赛博斗蛐蛐”环节,让模型之间进行互相点评,以多角度评估其生成内容的特点与优劣[31] 各AI模型表现分析 - **豆包**:在老年人赛道中表现“四平八稳”,对联“对仗工整”,符合传统审美[6];在年轻人赛道中能结合“搞钱、破圈、开挂”等网络热梗,被认为“懂年轻人”[17];在小学生赛道中使用叠词和意象,逻辑清晰[27];在互评环节展现出高情商,扮演“和事佬”角色并给出综合排名[40][42] - **Deepseek**:在老年人赛道中“用词整体非常讲究,文化底蕴拉满”,使用了“鹤算”、“兰玉”等典故词汇[7][8];在年轻人赛道中生成的对联被认为“很有画面感,网感也不错”,但可能更偏向程序员群体[19];在小学生赛道中采用第一人称写法,“充满了童趣”,但对仗有所放松[28];在互评环节主动充当“毒蛇评委”,并概括了其他模型的特点[32][33];但被指出在创作中出现了“吉羊”等生肖根本性错误[36][44] - **Gemini 3**:在老年人赛道中答案“朴实无华”,如“吃得好,睡得香”,语言直白但精准抓住用户需求[9][10];在年轻人赛道中创作出“不做牛马做黑马”、“只涨薪资不涨肉”等句子,被认为“戳中了很多打工人的痛点”,获评该赛道最佳[21][24];在小学生赛道中成功塑造了“聪明伶俐、活泼好学的小朋友形象”[29];在互评环节通过多维度星标图表进行客观分析[44] - **ChatGPT**:在老年人赛道中表现“过于稳妥”,像“用模板生成出来的,缺少了点灵魂”[11];在年轻人赛道中“不太懂什么是‘网感’”,内容显得“过于死板”[24];在小学生赛道中答案“很标准,但缺少了惊喜和童真,过于书面化”[30];在互评环节被其他模型评价为“传统规范,偏稳重保守”[40],并被指出“缺少‘记忆点和共鸣感’”[43] AI模型能力特点总结 - 不同AI大模型在内容创作上展现出差异化风格与能力倾向:豆包表现稳健、安全且受众匹配度高[40][44];Deepseek文采与创意突出,但可能存在规范性风险[36][40];Gemini 3创意强、洞察力佳且能精准定制[40][44];ChatGPT则更注重传统与规范,风格相对保守[11][24][40] - 通过特定场景(如春联创作)的横向对比,可以观察到各模型在文化底蕴、趣味网感、对仗押韵、受众匹配度等维度上的不同表现[44] - 评测表明,AI大模型在处理文字工作时,其输出内容的质量与特点高度依赖于对提示词的理解、对目标受众的把握以及对特定文化规则(如对联格式、生肖)的遵循能力[12][24][30][36]