每月 $40 跟幾天燒千美元,差距不在模型定價
同樣是跑 OpenClaw,有人每月 $40,有人幾天燒掉上千美元。很多人第一反應是「換便宜模型就好了」,但模型費率其實只是問題的表象。
我在 fintech 帶 backend team,內部用 OpenClaw 跑了大概三個月,踩過幾個坑之後把月費從 $600+ 壓到 $80 左右,主要做了兩件事:任務分層和行為約束。順序很重要:先做這兩件,再來談模型選擇。
任務分層
很多人一開始就把所有東西丟給 GPT-4o 或 Claude Opus,不管是「幫我整理這份 spec」還是「確認一下有沒有新 email」都用同一個模型。這是最直接的燒錢方式。
一個比較合理的分層概念是這樣:
Level 1 — 路由/判斷型任務:最便宜的模型(MiniMax、GPT-4o mini)
Level 2 — 一般對話/摘要:中階模型
Level 3 — 複雜推理/程式碼:高階模型(真的有需要才用)
OpenClaw 的 heartbeat 和 cron 幾乎都是 Level 1 的任務——「這則訊息需要我回應嗎」、「有沒有新的事件要處理」,根本不需要 GPT-4o。heartbeat 如果頻率設高一點又全用高階模型跑,每天光靠這個就能輕鬆吃掉幾十美元。
行為約束才是真正的坑
沒有 anti-loop 機制是最容易造成爆量的情況之一。我們有次忘記設 tool call 的最大次數限制,一個 agent 在某個 API 持續超時的情況下連續呼叫了 300+ 次,凌晨自動跑的,早上開 dashboard 才發現。那天單日成本是平常的 8 倍。
具體要控制的東西:
- 每個 session 的最大工具呼叫次數:我們設 50,複雜任務放寬到 100
- 失敗重試要有退後策略:指數退避,不是直接重試
- heartbeat 的決策粒度:先用最少 token 判斷「值不值得啟動後面的流程」,而不是直接進入完整的 agent loop
最後這點很多人忽略。heartbeat 的設計應該是「便宜的 guard」,用最小代價做第一層過濾,確定有事才升級到貴的流程。
模型費率是最後才調的
任務分層和行為約束到位之後,模型選擇才有意義。否則換了便宜模型,但 loop 還在跑、heartbeat 還在狂吃,省的那點費率差根本無感。
Reddit 那篇帖子的發文者用 OAuth + MiniMax2.7/GPT 5.4,每月 $40 是可信的,因為他的使用模式本來就是低頻、有分層的。你拿同樣的模型但用法不對,還是會燒錢。
換個方向說:如果你月費已經炸了,先去看 heartbeat 頻率設定和每個 session 的 tool call 上限,這兩個地方通常能找到 60-80% 的問題。模型費率是最後才需要動的旋鈕。
作者:鍵盤工人