Why Google's AI can't spell Google (or anything else)
谷歌谷歌(US:GOOG) TechCrunch·2026-05-28 08:17

文章核心观点 - Google 在其搜索产品中全面引入生成式 AI 功能(AI Overviews),但该功能在基础拼写和事实核查方面暴露出明显缺陷,例如错误计算单词中的字母数量和提供错误定义,这反映了当前大型语言模型(LLMs)在底层架构上的固有局限性 [1][2][5] Google AI Overviews 功能表现与问题 - Google AI Overviews 在回答基础问题时出现事实性错误,例如声称单词“Google”中有两个“P”,将“journalism”错误拼写为“journadism”,并将美国总统姓氏拼写为“trpum” [1] - 该功能并非首次出现问题,此前曾引用讽刺网站内容,建议用户“吃石头”和“在披萨上涂胶水” [2] - 尽管 Google 已修复部分问题(如搜索“disregard”显示错误定义),但拼写错误等基础问题因其顽固性而持续存在并引发关注 [5] 大型语言模型(LLMs)的技术架构与局限 - LLMs(如驱动 Google AI Overview 的模型)基于 Transformer 架构,其工作方式并非像人类一样“阅读”文本,而是将文本转换为数字编码(token)进行处理 [6][9] - 在此架构下,模型将文本分解为 token(可以是完整单词、音节或字母),例如模型知道“the”这个词的编码,但不知道其由“T”、“H”、“E”三个字母组成 [9] - 这种以 token 为基础的架构本质上是限制性的,研究人员对于能否彻底解决拼写问题并不乐观 [9] - 为语言模型确定何为完美的“词”(token)是一个难题,专家认为可能不存在完美的分词器,且模型倾向于进一步“分块”处理信息,这导致了模糊性 [10] 行业影响与启示 - LLMs 的核心效用并非拼写能力,其价值体现在快速编码、解决复杂问题等其他方面 [4][10] - 这些明显的失败案例提醒行业,AI 并非全知全能,其输出结果不能盲目信任,必须进行准确性复核 [10] - 将生成式 AI 作为其已有29年历史的核心搜索产品改造的中心,过程中出现失误在预料之中 [2]

Alphabet-Why Google's AI can't spell Google (or anything else) - Reportify