Claude Code của Anthropic đang vấp phải phản ánh từ người dùng trả phí về việc chạm trần hạn mức quá nhanh. Một người dùng gói Max 5x trị giá 100 USD/tháng cho biết dịch vụ nhiều lần chạm trần chỉ sau 90 phút, dù mức sử dụng không còn ở cường độ cao như trước đó.
Theo Gigazine ngày 14/4 (giờ địa phương), người dùng này đã đăng bài trên GitHub Issues để nêu vấn đề. Theo phản ánh, thời lượng sử dụng thực tế của Claude Code ngắn đến mức gần như không đáp ứng được nhu cầu công việc.
Claude hiện áp dụng cơ chế hạn mức theo chu kỳ 5 giờ. Khi vượt ngưỡng trong một chu kỳ, người dùng sẽ không thể tiếp tục sử dụng cho đến khi chu kỳ đó kết thúc. Gói Max 5x bị phản ánh có hạn mức cao gấp 5 lần gói Pro giá 20 USD/tháng.
Người dùng cho biết trong ngày xảy ra sự việc, họ làm việc liên tục từ 15h đến 20h để phát triển phần mềm. Trong khoảng thời gian này, tổng số lần gọi API lên tới 2.715, lượng ngữ cảnh xử lý tối đa khoảng 970.000 token. Tính năng tự động tóm tắt ngữ cảnh cũng được kích hoạt hai lần. Theo người này, việc bị giới hạn sau một đợt sử dụng cường độ cao như vậy là điều có thể chấp nhận.
Tuy nhiên, vấn đề phát sinh ở giai đoạn sau đó. Sau 20h, dù chỉ thực hiện các tác vụ phát triển nhẹ và trao đổi thông thường, người dùng vẫn tiếp tục hết hạn mức chỉ sau khoảng 1 giờ 30 phút. Khi rà soát nguyên nhân, người này cho biết đã phát hiện dấu hiệu một phiên Claude vẫn chạy nền và liên tục thực hiện lượng lớn thao tác đọc cache.
Từ đó, người dùng đặt nghi vấn về cơ chế tính hạn mức. Theo cách tính chi phí, phần dữ liệu đọc từ cache chỉ được tính bằng 1/10 dữ liệu đầu vào thông thường. Tuy nhiên, họ cho rằng khi tính hạn mức sử dụng, hệ thống có thể đã không áp dụng cùng nguyên tắc này, mà tính phần dữ liệu từ cache theo toàn bộ lượng token gốc.
Vấn đề cũng gắn với chiến lược phát triển cửa sổ ngữ cảnh lớn của Claude. Claude Code cung cấp cho người dùng trả phí cửa sổ ngữ cảnh tối đa 1 triệu token. Đây vốn được xem là lợi thế vì cho phép xử lý nhiều thông tin hơn trong một lần, nhưng theo người dùng nói trên, nếu dữ liệu từ cache vẫn bị tính ở mức đầy đủ thì cửa sổ ngữ cảnh càng lớn, số token đầu vào cho mỗi lần gọi API càng tăng, từ đó khiến người dùng nhanh chạm trần hơn. Nói cách khác, mốc 1 triệu token có thể khiến hạn mức bị tiêu hao nhanh hơn thay vì trở thành điểm cộng.
Người dùng này cũng cho rằng một phiên chỉ mở ở chế độ nền, không có thao tác trực tiếp, không nên tiêu thụ lượng lớn API. Nếu các hoạt động nền không phục vụ công việc thực tế nhưng vẫn làm hạn mức cạn nhanh, giá trị sử dụng của gói trả phí sẽ giảm đáng kể.
Phía phát triển Claude Code đã lên tiếng phản hồi. Một thành viên phụ trách cho biết nhóm đang xem xét các biện pháp như thu hẹp cửa sổ ngữ cảnh mặc định và chủ động dọn dẹp các tác vụ nền. Dù không thừa nhận có vấn đề trong cấu trúc tính hạn mức, nhóm phát triển cho thấy họ đã bắt đầu triển khai các bước nhằm giảm tình trạng này.
Diễn biến trên cũng phần nào phản ánh bài toán vận hành của Anthropic. Công ty gần đây tăng trưởng nhanh, với doanh thu trong ba tháng qua được cho là đã tăng hơn gấp ba. Tuy nhiên, trong ngắn hạn, Anthropic vẫn được nhắc đến trong bối cảnh thiếu tài nguyên tính toán và trước đó từng cho biết sẽ siết giới hạn sử dụng để ứng phó áp lực tải hệ thống.
Theo Gigazine, người dùng gần đây cũng liên tục phản ánh chất lượng phản hồi của Claude suy giảm, đồng thời cho rằng thời gian hiệu lực của cache bị rút ngắn khiến hạn mức bị tiêu hao nhanh hơn. Tranh cãi lần này cho thấy khoảng cách giữa giới hạn tài nguyên tính toán, thiết kế gói dịch vụ và trải nghiệm sử dụng thực tế của người dùng các dịch vụ AI hiệu năng cao.