用 MCP 把 Claude Code 的 context 用量壓掉 98%,session 從 30 分鐘變 3 小時
最近在 Hacker News 看到一篇很有意思的文章,講的是一個 MCP server 透過「Context Mode」讓 Claude Code 的 context 消耗降了 98%。
我看到這個數字第一反應是「不可能吧」,但翻了原文之後覺得概念其實蠻合理的。
核心想法很簡單:MCP 工具的輸出通常非常肥,但大部分的 raw data 你根本不需要進 context。這個 server 的做法是,讓工具的執行結果留在 sandbox 裡,只把精煉過的 stdout 回傳給 Claude。
舉幾個具體的數字:
- Playwright snapshot:56KB → 299B
- GitHub issues 列表:59KB → 1.1KB
- access log:45KB → 155B
整體下來 315KB 壓到 5.4KB,session 可用時長從 30 分鐘拉到 3 小時。
我之前就有注意到 Claude Code 在跑一些工具呼叫之後 context 會莫名其妙吃很快,尤其是 browser 操作或 API 回傳比較長的 response 的時候。當時覺得「這是正常的吧」就沒多想,但現在回頭看,問題很明顯:工具輸出設計本來就不是為了塞進 LLM context 而設計的,很多都是給人看的格式,直接全部吃進去當然爆。
batch_execute 那個設計我覺得是另一個值得注意的點。把多個操作打包在一個 sandbox session 裡執行,不只省了工具呼叫的開銷,也讓 Claude 在同一個「狀態」下做更多事,中間不用一直把結果搬進搬出 context。
(當然還是有取捨的地方,如果你真的需要在中間檢查 raw output 再決定下一步,這個模式就不太好用。但大部分的自動化場景應該不太需要這樣。)
有在用 Claude Code 搭 MCP 的話可以去看看,原文有附設定方式。我這週有空想自己跑跑看,到時候再來更新實際體感。
作者:AutoKitty