对联创作 - 财报，业绩电话会，研报，新闻

对联创作

搜索文档

36氪· 2026-02-21 09:42

AI大模型内容创作能力评测 - 文章通过设置针对老年人、年轻人、小学生三大群体的春联创作比赛，对ChatGPT、Gemini 3、豆包、Deepseek四款AI大模型在内容生成能力上进行横向评测[3] - 评测设置了三个不同风格要求的赛道：针对老年人的“传统喜庆、稳重典雅”[5]；针对年轻人的“新潮朝气、更具网感、更接地气”[14]；针对小学生的“童真活泼、简单易懂”[25] - 评测过程不仅包含模型对联生成，还引入了“赛博斗蛐蛐”环节，让模型之间进行互相点评，以多角度评估其生成内容的特点与优劣[31] 各AI模型表现分析 - **豆包**：在老年人赛道中表现“四平八稳”，对联“对仗工整”，符合传统审美[6]；在年轻人赛道中能结合“搞钱、破圈、开挂”等网络热梗，被认为“懂年轻人”[17]；在小学生赛道中使用叠词和意象，逻辑清晰[27]；在互评环节展现出高情商，扮演“和事佬”角色并给出综合排名[40][42] - **Deepseek**：在老年人赛道中“用词整体非常讲究，文化底蕴拉满”，使用了“鹤算”、“兰玉”等典故词汇[7][8]；在年轻人赛道中生成的对联被认为“很有画面感，网感也不错”，但可能更偏向程序员群体[19]；在小学生赛道中采用第一人称写法，“充满了童趣”，但对仗有所放松[28]；在互评环节主动充当“毒蛇评委”，并概括了其他模型的特点[32][33]；但被指出在创作中出现了“吉羊”等生肖根本性错误[36][44] - **Gemini 3**：在老年人赛道中答案“朴实无华”，如“吃得好，睡得香”，语言直白但精准抓住用户需求[9][10]；在年轻人赛道中创作出“不做牛马做黑马”、“只涨薪资不涨肉”等句子，被认为“戳中了很多打工人的痛点”，获评该赛道最佳[21][24]；在小学生赛道中成功塑造了“聪明伶俐、活泼好学的小朋友形象”[29]；在互评环节通过多维度星标图表进行客观分析[44] - **ChatGPT**：在老年人赛道中表现“过于稳妥”，像“用模板生成出来的，缺少了点灵魂”[11]；在年轻人赛道中“不太懂什么是‘网感’”，内容显得“过于死板”[24]；在小学生赛道中答案“很标准，但缺少了惊喜和童真，过于书面化”[30]；在互评环节被其他模型评价为“传统规范，偏稳重保守”[40]，并被指出“缺少‘记忆点和共鸣感’”[43] AI模型能力特点总结 - 不同AI大模型在内容创作上展现出差异化风格与能力倾向：豆包表现稳健、安全且受众匹配度高[40][44]；Deepseek文采与创意突出，但可能存在规范性风险[36][40]；Gemini 3创意强、洞察力佳且能精准定制[40][44]；ChatGPT则更注重传统与规范，风格相对保守[11][24][40] - 通过特定场景（如春联创作）的横向对比，可以观察到各模型在文化底蕴、趣味网感、对仗押韵、受众匹配度等维度上的不同表现[44] - 评测表明，AI大模型在处理文字工作时，其输出内容的质量与特点高度依赖于对提示词的理解、对目标受众的把握以及对特定文化规则（如对联格式、生肖）的遵循能力[12][24][30][36]