Anthropic Claude(图片来源:Shutterstock)

Anthropic旗下AI聊天机器人Claude近期收紧用量限制后,部分用户反映,即便只是常规使用,额度也会很快耗尽。

据日媒Gigazine当地时间14日报道,一名订阅月费100美元“Max 5x”套餐的用户日前在GitHub Issue中发帖称,“额度在1小时30分钟内就被耗尽,几乎无法正常用于工作。”

Claude目前按5小时为一个周期管理用量。一旦用户在该周期内达到上限,在本轮5小时周期结束前将无法继续使用。根据Anthropic的说明,“Max 5x”套餐的额度约为月费20美元Pro套餐的5倍。

上述用户表示,事发当天下午15时至20时,其集中进行开发工作,5小时内共进行了2715次API调用,最大上下文长度一度接近97万Token,其间还触发了两次上下文自动摘要。对于高强度使用后触及限制,该用户表示可以接受。

不过,争议出现在此后。该用户称,20时之后自己仅进行轻量开发和问答等常规操作,仍在约90分钟内再次触及用量限制。排查过程中,用户怀疑后台未关闭的Claude会话触发了大量缓存读取。

该用户进一步指出,按官方计费规则看,缓存读取(缓存输入)通常按普通输入的十分之一计费,但在用量限制的计算中,相关部分可能并未按这一比例折算。换言之,缓存读取有可能不是按折后口径计入,而是按原始量全额计入额度。

这一争议也指向Claude主打的大上下文能力。Claude Code面向付费用户提供最高100万Token的上下文窗口,卖点在于可一次处理更多信息。但用户质疑称,如果缓存读取按原始量全额计入,那么上下文窗口越大、单次API调用输入的Token越多,额度就越容易被迅速耗尽。按这一逻辑,100万Token上下文窗口未必完全是优势,反而可能加快额度消耗。

该用户还表示,那些仅在后台打开、并未实际操作的空闲会话,不应消耗大量API额度。如果与实际工作无关的后台活动也会持续占用额度,套餐的实际使用价值将明显下降。

对此,Claude Code开发团队已作出回应。一名负责人表示,团队将研究“进一步缩小默认上下文窗口”以及“更积极地清理后台任务”等方案。虽然其并未直接承认用量计算机制存在问题,但已着手采取措施,以降低相关影响。

报道还称,此次争议也与Anthropic当前的服务运营状况有关。过去3个月,Anthropic营收增长超过3倍,正处于快速扩张阶段,但短期内外界普遍认为其算力资源仍较为紧张。公司此前也曾表示,为应对系统负载,将进一步收紧用量限制。

在这一背景下,用户社区中近期还出现了“Claude回答质量明显下滑”的反馈,也有观点认为缓存有效期缩短,导致额度消耗进一步上升。此次争议反映出,在算力受限的情况下,高性能AI服务在套餐设计与实际使用体验之间仍存在明显落差。

关键词

#Anthropic #Claude #Claude Code #用量限制 #Max 5x #Pro套餐 #最高100万Token上下文窗口 #缓存读取 #算力资源
版权所有 © DigitalToday。未经授权禁止转载或传播。