首页 幣資訊 正文
9e6abe99-8c0f-4c91-ae86-61b32b004d8c.png

Claude程式碼額度暴減二十倍

幣資訊 2026-04-03 3

4–17%。這是過去一個月裡,Claude Code 的 prompt cache 讀取率。正常水準應為 97–99%。

這代表:當你恢復先前會話時,Claude Code 並未重用已處理過的上下文,而是每次從頭完整解析全部內容——導致額度消耗達正常情況的 10 至 20 倍。你以為在延續對話,實際上每一次都在支付「全價」、開啟一段全新對話。

此數據來自獨立開發者 ArkNill 的代理監控實測。他透過透明代理完整擷取 Claude Code 與 Anthropic API 間所有請求,確認至少存在兩個客戶端緩存 Bug,致使伺服器無法比對已快取的對話前綴,被迫每輪均執行完整的 token 重建作業。

上圖呈現三階段緩存讀取率對比: • v2.1.69 至 v2.1.89(Bug 存在期):Standalone 版本緩存讀取率僅 4–17%; • v2.1.90(修復一項關鍵 Bug):冷啟動階段緩存讀取率回升至 47–99.7%; • v2.1.91(全面修復):穩定運作下緩存讀取率恢復至 97–99%。

值得注意的是,v2.1.90 的讀取率範圍跨度極大(47% 至 99.7%),主因是會話初恢復時需「預熱」緩存——前幾輪命中率偏低,但可快速回穩;而在 Bug 版本中,此預熱機制完全失效:緩存讀取永遠卡在系統提示詞的 14,500 個 token,所有對話歷史皆按全量計費。


28 天、20 個版本:一個被掩蓋的效能危機

此問題並非單次更新引入、單次更新修復。根據 npm registry 發佈紀錄: • 問題版本 v2.1.69 於 3 月 4 日發布; • 初步修復版本 v2.1.90 於 4 月 1 日發布; • 兩者相隔 28 天,橫跨 20 個正式版本。

時間線揭示一項關鍵細節:3 月 4 日 bug 上線後,用戶並未立即大規模投訴;直到 3 月 23 日才集中爆發——中間延遲近三週。原因在於 GitHub Issue #41930 的梳理指出:3 月 13 日至 28 日,Anthropic 曾推出「離峰時段額度雙倍」促銷活動,客觀上掩蓋了緩存異常所導致的額度異常耗損。促銷結束後,真實消耗回歸計費基線,用戶額度瞬間「蒸發」。

Anthropic 官方回應滯後明顯: • 3 月 26 日(投訴爆發三天後),工程師 Thariq Shihipar 於個人 X 帳號宣布高峰時段(工作日 5am–11am PT)配額收緊; • 3 月 30 日,Anthropic 於 Reddit 公開承認「用戶觸達配額上限速度遠超預期」,並列為團隊最高優先級; • 直至 4 月 1 日,團隊成員 Lydia Hallie 才發布正式調查結論。

全程無任何官方部落格公告、無郵件通知、無狀態頁更新。所有溝通僅透過工程師個人社群貼文及少數 Reddit 回覆完成。


你的訂閱到底能撐多久?真實用戶耗損報告

GitHub Issue #41930 汇集數百則用戶實測回報,呈現驚人消耗速度: • Max 20x 訂閱用戶($200/月):5 小時滾動配額於 19 分鐘內耗盡; • Max 5x 訂閱用戶($100/月):5 小時配額於 90 分鐘內用完; • The Letter Two 報導指出,有用戶僅輸入「hello」即消耗 13% 會話配額; • Pro 訂閱用戶($20/月)於 Discord 表示:「每週一就用完額度,要等到週六才重置」——30 天中僅 12 天可正常使用。

ArkNill 基準測試進一步驗證: • 在問題版本 v2.1.89 下,Max 20x 方案的 100% 配額約於 70 分鐘內耗盡; • 單次 --resume 操作針對 500K token 上下文會話,額度成本高達約 $0.15——因系統強制重播全部上下文。


「是你用錯了」?官方回應引發強烈質疑

Lydia Hallie 的調查結論確認兩點: 1. 高峰時段配額確實收緊; 2. 100 萬 token 上下文會話之消耗顯著上升。 她表示團隊已修復若干 Bug,但明確強調:「沒有任何一個 Bug 導致多收費」。

隨後提出四項「省額度建議」: 1. 改用 Sonnet 4.6,而非 Opus(Opus 消耗速率約為前者兩倍); 2. 無需深度推理時,降低推理強度或關閉 extended thinking; 3. 已閒置超過一小時的長會話,請勿恢復,應另開新會話; 4. 設定環境變數 CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000,手動限制上下文大小。

全文未提及任何形式的配額補償、重置或服務補償措施。

AI 播客主持人 Alex Volkov 將此回應精準概括為「你拿的方式不對」(You're holding it wrong)。他指出:Anthropic 自行將 100 萬 token 上下文設為預設值、將 Opus 作為旗艦模型推廣、將 extended thinking 列為核心賣點,如今卻要求付費用戶主動避開這些功能。

「並未多收費」之說法,亦與 Claude Code 自身更新紀錄產生矛盾:就在 Lydia 發布結論的前一天,v2.1.90 明確標註修復一項自 v2.1.69 起存在的「緩存回歸 Bug」——使用 --resume 恢復會話時,本應命中快取的請求持續觸發完整 prompt cache miss,造成全額計費。此項已確認之計費異常,在官方結論中完全未被提及。

對照參考:OpenAI Codex 此前亦曾發生類似額度異常耗損。其處理方式為——立即重置用戶配額、補發 credits,並於 3 月正式移除 Codex 使用上限。Anthropic 的做法則是:建議用戶降級模型、關閉功能、壓縮上下文,並將責任歸因於「用戶使用方式」。

Anthropic 所銷售的,是「最強模型 + 最大上下文 + 最高推理能力」的訂閱服務,每月收取 20 至 200 美元費用。一個橫跨 28 天、影響 20 個版本的緩存 Bug,使付費用戶額度以 10–20 倍速度蒸發;而官方最終回應,僅是勸你「省著點用」。

点赞0
史低價來襲!《生化4:重製版》衝進Steam銷量前五
« 上一篇 2026-04-03
PC玩家將失望!索尼新戰略專攻獨佔遊戲
下一篇 » 2026-04-03