Workflow
主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK
虎嗅·2025-08-17 12:08

最近半个月,国内的AI大玩家里,智谱的动作也很受关注。他们此前推出的GLM-4.5模型,在逻辑推理、代码编写及工具调用等方面实现了非常大的提 升。 就在前几天,智谱在GLM-4.5模型的基础上,推出了一个全新的GLM-4.5V视觉推理模型,而且这个模型是开源模型。据我了解,这个模型在42项公开的 视觉基准测试中,斩获了41项第一,这简直就是"霸榜"了。 只不过这半年来,AI领域发展极快,智谱这种更偏技术型的公司,在声量上并不大 。这次他们推出的这款GLM-4.5V视觉开源模型,从业内的评价来看, 都非常高,这也极大地勾起了我的好奇心,想要测试下几款主流AI工具,看看它们的识图能力到底如何。 评测任务 首先,我必须要"叠个甲",那就是我今天的评测只针对一个小场景,难免会有很多遗漏和不够全面的地方。如果你要选AI工具来处理自己的任务,也可以 像我这样,自己多试试。 我选择的这个评测任务,灵感来自于上周刚结束的国际人工智能奥林匹克竞赛。这次比赛是在北京市十一学校举办的,个人赛中有一道题目很有意思:全 球近300名天才高中生要想办法让AI可以识别不同的男女卫生间标识。 这道题目最终只有个人赛的第一名,也就是波兰选手罗 ...