管理人の一言
やっほー!国内のAI狂いこと、当ブログの管理人だよ!今日もAIの深淵を覗き込んでるかな?今、開発者の間で激震が走っているのが「ClaudeCode」の制限問題。最強のコーディングアシスタントとして鳴り物入りで登場したけど、Proプランなのに「数回話しただけで制限がかかる」っていう阿鼻叫喚の事態になってるんだ。
原因はどうやら技術的な不具合、いわゆる『キャッシュ無効化バグ』にあるみたい。本来なら一度読み込んだコードは『キャッシュ』として保存して、次からはトークンを節約できるはずなんだけど、特定の条件でこれが全部リセットされちゃうんだって。
例えるなら、辞書を引くたびに毎回一ページ目から読み直してるようなもの。これじゃあトークン(AIの通信量)がいくらあっても足りないよね!Gemini推しの私としては、100万トークンを涼しい顔で処理するGoogle先生の太っ腹さが恋しくなっちゃうけど、今日はこの『溶けるトークン』の裏側をじっくり解説していくよ!
3行でわかる!今回の話題
- Anthropicのコーディング支援ツール「ClaudeCode」において、Proプランでも数回のプロンプトで利用制限に達するユーザーが続出しているよ。
- 特定の文字列(請求・トークン等)に反応してキャッシュが無効化されたり、再開コマンド(–resume)でトークンを二重消費したりする致命的なバグが指摘されているんだ。
- 「トークン消費が怖くて仕事にならない」という声もあり、GLMやQwenといった他社モデルへの乗り換えを検討する動きも出始めているね。
Claude Code users hitting usage limits ‘way faster than expected’
https://www.theregister.com/2026/03/31/anthropic_claude_code_limits/
Anthropicが提供するAIコーディングアシスタント「Claude Code」において、ユーザーから「利用枠(クォータ)が想定以上に早く消費される」という不満が相次いでいます。 開発者からは「1時間で1日分を使い切ってしまう」「自動ワークフローで予算が瞬時に消える」といった報告が寄せられており、業務に支障が出る事態となっています。Anthropic側はこれを重要課題として調査中ですが、原因としてプロンプトキャッシュのバグによるコスト増大や、最近の利用枠制限の変更などが指摘されています。 AI開発ツールは普及が進む一方、コスト管理と利便性のバランスが課題となっており、ベンダー側の提供モデルとユーザーの期待との間で大きな乖離が浮き彫りになっています。
Proプランなのに数回プロンプト投げただけで終了のお知らせ。これ不具合だろ……。
透明性ゼロすぎて草。適当な「バグでしたw」で済ませようとしてる感。
特定の文字列置換が原因でキャッシュが無効化されてるらしい。
?s=20
https://twitter.com/om_patel5/status/2038754906715066444
会話の中で「請求」とか「トークン」の話が出ると、特定の内部置換が走ってせっかくのキャッシュが無効化。最初から全部再構築されるからトークンが爆速で溶ける。悪意はないんだろうけど、お粗末すぎんだろw
Sonnet4.6は神だけど、これじゃ仕事にならん。KimiとかQwen3とかに乗り換えるわ。
SonnetとGPT-4oを入れ替えても、ぶっちゃけ違い分からん奴が大半だと思うわ。高い金払って高いトークン消費して、「これが最高なんだ」って自己暗示かけてるだけw
【ゆでガエル作戦】
カエルをいきなり熱湯に入れると逃げ出すけど、水から徐々に熱すると気づかずに茹で上がるという話から、少しずつ条件を悪くしてユーザーを慣れさせる手法を皮肉った表現だね。【–resume】
ClaudeCodeで前の作業を再開するためのコマンドだよ。本来は効率化のための機能なのに、これを使うたびにキャッシュが再構築されて余計な料金(トークン)がかかっているというバグが指摘されているよ。管理人のまとめ
今回の騒動、単なる『バグでした、ごめんね』で済む話じゃないと私は睨んでるよ!技術的な視点で見ると、大規模言語モデル(LLM)をCLIツールでリポジトリ全体に適用する際の『ステート管理』の難しさが露呈した形だね。
特に`–resume`フラグや内部的な文字列置換でキャッシュが飛ぶっていうのは、Pythonで高度なラッパーを組む時にも一番神経を使う、いわばAI開発の『急所』。Anthropicはモデルの賢さに全振りした反面、それを支えるインフラ層の最適化がまだ甘かったのかもしれないね。
もっと踏み込んだ考察をすると、これはAI業界全体の『ビジネスモデルの限界』を示唆しているとも言えるよ。掲示板でも指摘されていたけど、『ヘビーユーザーほど赤字を生む』という構造がある限り、運営側にはサイレントで制限を厳しくするインセンティブが働いちゃうんだ。
ユーザー側が『トークン不安』に怯えながらプロンプトを打つなんて、知的な創作活動としては健全じゃないよね。将来的には、計算資源の状況に応じてリアルタイムで価格が変わる『ダイナミック・プライシング』が標準になる可能性も高いよ。
でも、絶望することはないよ!これからは、AIに丸投げするんじゃなくて、Pythonスクリプトを自分で書いて必要なコンテキストだけを抽出して渡すような、『盆栽のお手入れ』的な使いこなし術がエンジニアの必須スキルになるはず。
私としては、圧倒的なコンテキストウィンドウを持つGemini1.5ProをPythonから叩いて、自分でキャッシュ制御を実装しちゃうのが一番の解決策だと思うな!道具に踊らされるんじゃなくて、私たちがAIの計算資源をハックする側になろうね!






