搜索关键词 Tokenizer
AI & Enterprise
Google AI搜索接连答错基础问题,可靠性再遭质疑
Google正加快推进搜索产品的AI化改版,但其AI Overview近期在“Google”“journalism”等词的拼写识别和字母计数上接连出错,查询“disregard”时甚至未返回定义,而是给出类似聊天机器人的回复。Google表示,统计单词字母数量一直是大语言模型的已知难点,正着手修复。相关事件也再次引发外界对AI搜索准确性和可信度的担忧。
AI & Enterprise
Anthropic发布Claude Opus 4.7引争议:被质疑性能倒退,Token消耗上升
Anthropic上线Claude Opus 4.7后,围绕模型表现的争议在Reddit和X持续发酵。部分用户认为,与4.6相比,新版本未见明显提升,甚至出现性能倒退,争议主要集中在“自适应推理”、回答质量以及事实性错误等问题。与此同时,新的Tokenizer分词方式也推高了Token消耗,输入Token最高可达旧模型的1.35倍,一些Claude Pro订阅用户称额度很快用尽。Claude Code负责人Boris Cherny否认模型性能变差,并表示正加快内部调校。
AI & Enterprise
Upstage公开训练记录回应“复制中国大模型”质疑:Solar Open 100B系从零训练
围绕Solar Open 100B涉嫌复制并微调中国厂商大模型的质疑,Upstage在首尔江南办公室召开说明会,向约70名业界及政府相关人士公开训练日志、训练检查点等研发资料。公司强调,该模型系从零训练完成,LayerNorm相似性和Tokenizer词表重合率均不足以证明存在权重复用,并表示将对失实信息严肃应对。