Google正将AI置于搜索产品改版的核心位置,但其AI搜索近期接连暴露出基础拼写和信息处理错误,令外界再次对其可靠性产生质疑。
据科技媒体TechCrunch当地时间27日报道,Google的AI Overview在一些最基础的字符和拼写问题上出现明显失误。例如,在回答“Google”的拼写相关问题时,系统给出了错误结果;对于“poop”的字母组成,也作出了不准确的解释;在处理“journalism”时,甚至错误拼写为“j-o-u-r-n-a-d-i-s-m”。此外,在涉及美国总统姓氏拼写的相关问题中,AI Overview同样混淆了字母数量,并给出“t-r-p-u-m”等错误答案。
除拼写问题外,词义查询也出现异常。通常情况下,用户搜索单词时,系统会返回词典释义;但在查询“disregard”时,AI Overview并未给出定义,反而回复了“好的。如有新问题请告诉我”等类似聊天机器人的内容。
对于上述问题,Google回应称,统计单词中字母数量一直是大语言模型的已知难点,公司目前正在推进修复。
在业内看来,这类问题已不只是个别功能失灵,而是在进一步放大AI搜索的整体可信度争议。搜索服务的核心前提是准确提供信息,如果AI摘要的加入反而削弱了结果的准确性和稳定性,用户将更难判断这些回答究竟可信到什么程度。
随着连基础信息处理都频频出错,围绕原因的讨论也持续升温。专家普遍认为,这与大语言模型(LLM)的结构性局限有关。LLM并不是像人类那样逐个字符读取文本,而是先将文本切分为token后再进行处理。因此,模型往往难以稳定识别单词边界,即便采用不同的token切分方式,也很难实现完整、精确的字符级处理。
美国东北大学博士研究生Sheridan Feucht指出,“不存在完美的分词器(tokenizer)”,而模型倾向于将文本继续切分为更小单位,这种特征本身就已写入其结构之中。
也有观点认为,这类限制并不必然意味着LLM整体能力不足,原因在于其在代码生成和复杂问题求解等领域依然表现出较高实用价值。即便如此,此次事件仍再次提醒市场:随着AI能力持续提升,其输出结果仍不应被无条件信任。