Alphabet-Why Google's AI can't spell Google (or anything else)

文章核心观点 - Google 在其搜索产品中全面引入生成式 AI 功能（AI Overviews），但该功能在基础拼写和事实核查方面暴露出明显缺陷，例如错误计算单词中的字母数量和提供错误定义，这反映了当前大型语言模型（LLMs）在底层架构上的固有局限性 [1][2][5] Google AI Overviews 功能表现与问题 - Google AI Overviews 在回答基础问题时出现事实性错误，例如声称单词“Google”中有两个“P”，将“journalism”错误拼写为“journadism”，并将美国总统姓氏拼写为“trpum” [1] - 该功能并非首次出现问题，此前曾引用讽刺网站内容，建议用户“吃石头”和“在披萨上涂胶水” [2] - 尽管 Google 已修复部分问题（如搜索“disregard”显示错误定义），但拼写错误等基础问题因其顽固性而持续存在并引发关注 [5] 大型语言模型（LLMs）的技术架构与局限 - LLMs（如驱动 Google AI Overview 的模型）基于 Transformer 架构，其工作方式并非像人类一样“阅读”文本，而是将文本转换为数字编码（token）进行处理 [6][9] - 在此架构下，模型将文本分解为 token（可以是完整单词、音节或字母），例如模型知道“the”这个词的编码，但不知道其由“T”、“H”、“E”三个字母组成 [9] - 这种以 token 为基础的架构本质上是限制性的，研究人员对于能否彻底解决拼写问题并不乐观 [9] - 为语言模型确定何为完美的“词”（token）是一个难题，专家认为可能不存在完美的分词器，且模型倾向于进一步“分块”处理信息，这导致了模糊性 [10] 行业影响与启示 - LLMs 的核心效用并非拼写能力，其价值体现在快速编码、解决复杂问题等其他方面 [4][10] - 这些明显的失败案例提醒行业，AI 并非全知全能，其输出结果不能盲目信任，必须进行准确性复核 [10] - 将生成式 AI 作为其已有29年历史的核心搜索产品改造的中心，过程中出现失误在预料之中 [2]