Anthropicの「Claude」 写真=Shutterstock

AnthropicのAIチャットボット「Claude」を巡り、有料プランでも短時間で利用上限に達するとの声が上がっている。月額100ドルの「Max 5x」プラン利用者は、GitHubのIssueで「通常の業務利用でも1時間半で再び制限に達した」と訴え、上限算定の仕組みに疑問を呈した。

Gigazineが14日付で報じたところによると、問題を指摘したのは「Max 5x」プランの利用者だ。同プランは、月額20ドルの「Pro」プランに比べて利用上限が5倍とされている。

Claudeは、5時間ごとの区間で利用量を管理している。区間内で一定量に達すると、利用開始から5時間が経過するまで追加利用が制限される仕組みだ。

この利用者は問題当日、15時から20時にかけて開発作業を集中的に進めた。この間のAPI呼び出し回数は2715回に上り、最大コンテキスト長は約97万トークンまで拡大した。コンテキストの自動要約も2回実行されたという。利用者は、こうした高負荷の使い方の末に制限がかかること自体は受け入れられるとしている。

ただ、その後の挙動に疑問を示した。20時以降は軽い開発作業や質疑応答など、比較的一般的な使い方に切り替えたにもかかわらず、約1時間30分で再び利用制限に達したという。

原因を調べる過程で、バックグラウンドで開きっぱなしになっていたClaudeのセッションが、大量のキャッシュ読み取りを実行していたことも確認したとしている。

利用者によると、料金計算ではキャッシュ由来の入力は通常入力の10分の1として扱われる。一方で、実際の利用上限の算定では同様の軽減が反映されていない可能性があるという。キャッシュ読み取りが10分の1ではなく、元のトークン量のまま計上されているのではないか、というのが利用者側の主張だ。

この指摘は、Claude Codeが打ち出している大容量コンテキスト路線とも関わる。Claude Codeは有料ユーザー向けに最大100万トークンのコンテキストウィンドウを提供している。

一度に多くの情報を扱える点は利点とされるが、利用者は「キャッシュ読み取りが通常と同じペースで計算されるなら、コンテキストウィンドウが広いほどAPI呼び出し1回当たりの入力トークンが増え、上限に達しやすくなるのではないか」と指摘した。100万トークン対応が利点ではなく、むしろ上限到達を早める可能性があるという見方だ。

さらに利用者は、「バックグラウンドで開いているだけの、操作していないアイドルセッションが大量のAPIを消費すべきではない」とも主張した。実作業と関係のないセッションの活動で上限消費が進むのであれば、プランの実質的な価値が大きく下がるためだ。

これを受け、Claude Codeの開発チームも対応を検討している。担当者は、「デフォルトのコンテキストウィンドウを狭める案」や「バックグラウンド作業の整理をより積極的に進める案」などを挙げた。

もっとも、開発側が利用量算定の仕組みそのものに問題があると認めたわけではない。それでも、影響を抑えるための対策検討に入った形だ。

背景にはAnthropicの運用環境もある。Anthropicは直近3カ月で売上高が3倍以上に増えるなど急成長している一方、短期的には計算資源が不足しているとされる。同社は負荷対応のため、利用制限をより厳格化する方針を示していた。

こうした状況もあり、ユーザーの間では最近、Claudeの応答品質が目に見えて低下したとの声に加え、キャッシュの有効期限が短くなり、利用量の消費が増えたとの指摘も出ている。

今回の議論は、高性能AIサービスを巡る計算資源の制約と料金設計、そして実際の使い勝手とのずれを改めて浮き彫りにした。

キーワード

#Anthropic #Claude Code #生成AI #利用制限 #コンテキストウィンドウ #キャッシュ
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.