简体中文 < 文章列表 - 数字今日 (DigitalToday)

搜索关键词 Tokenizer

AI & Enterprise

Google AI搜索接连答错基础问题，可靠性再遭质疑

Google正加快推进搜索产品的AI化改版，但其AI Overview近期在“Google”“journalism”等词的拼写识别和字母计数上接连出错，查询“disregard”时甚至未返回定义，而是给出类似聊天机器人的回复。Google表示，统计单词字母数量一直是大语言模型的已知难点，正着手修复。相关事件也再次引发外界对AI搜索准确性和可信度的担忧。

AI & Enterprise

Anthropic发布Claude Opus 4.7引争议：被质疑性能倒退，Token消耗上升

Anthropic上线Claude Opus 4.7后，围绕模型表现的争议在Reddit和X持续发酵。部分用户认为，与4.6相比，新版本未见明显提升，甚至出现性能倒退，争议主要集中在“自适应推理”、回答质量以及事实性错误等问题。与此同时，新的Tokenizer分词方式也推高了Token消耗，输入Token最高可达旧模型的1.35倍，一些Claude Pro订阅用户称额度很快用尽。Claude Code负责人Boris Cherny否认模型性能变差，并表示正加快内部调校。

AI & Enterprise

Upstage公开训练记录回应“复制中国大模型”质疑：Solar Open 100B系从零训练

围绕Solar Open 100B涉嫌复制并微调中国厂商大模型的质疑，Upstage在首尔江南办公室召开说明会，向约70名业界及政府相关人士公开训练日志、训练检查点等研发资料。公司强调，该模型系从零训练完成，LayerNorm相似性和Tokenizer词表重合率均不足以证明存在权重复用，并表示将对失实信息严肃应对。