Workflow
看好了,这才是7家大模型做高考数学题的真实分数。
数字生命卡兹克·2025-06-09 06:05

这两天,很多媒体都在写用AI考高考题的内容。 我本来真的没打算卷这个选题,因为知道大家肯定都会写,都会卷,我也想休息休息,真的就不打算写了。 但是吧,用AI测语文考试还没啥,但是看了一些用AI做数学考试的文章,真的给我看的一脸地铁老头表情包,就,那个测试方法,也特么太扯淡了。 我觉得既然是考试,那就公平公正的去测试? 当然,你要是玩整活,那就另谈了。 结果最后得出一些不太靠谱的结论,我觉得还是蛮误导大家的。 客观、公平、公正,是我觉得最核心的标准。 所以我觉得,我想按照我的玩法,再严谨一点的测一下大模纯数学能力型高考,给大家看一下,真实客观的评分。 测试试卷为2025年数学全国一卷。 测试规则如下: 1. 不考解答题(因为给我标准答案我也看不懂,不知道咋给分。。) 2. 所有的题目截图全部使用LaTeX编辑器转成LaTeX文本格式,再扔给大模型进行回答。 LaTeX是学术界最广泛使用的数学公式排版语言,能最精确地表达数学符号,我们考的是模型的数学能力,不是考模型的多模态识图能力,比如 DeepSeek根本就没多模态,用的是OCR提取文本,很可能识别错误,所以截图上传不公平,一律转化成LaTeX格式再进行统一测 ...