OpenClaw 跑了幾個月,成本是這樣控下來的
最近 Reddit 有個討論蠻有共鳴的,有人說跑 OpenClaw 15 分鐘就燒了 €10,底下一群人在問「你們到底怎麼跑的」。看完整串討論,原 PO 的需求說穿了就是 lead gen 加上幾個簡單 workflow,直接把 Claude Sonnet 接上去跑所有 node,成本當然爆。
問題不是工具貴,是沒做任務分層。
把任務分三層,是最值得花時間的事
我自己跑了一段時間之後,大致把任務分成這樣:
L1 - 結構化、可預期:分類、欄位萃取、條件判斷、填模板。這種用 Haiku 或 Gemini Flash 就夠,跟 Sonnet 的成本差超過 10 倍,但對輸出品質幾乎沒差。
L2 - 需要理解意圖:摘要、回應草稿、輕量 RAG 查詢。用 Sonnet 或同等級,但一定要開 prefix caching。同一段 system prompt 反覆送,開了之後大概能省 70-80%。
L3 - 真的需要推理:agent planning、複雜判斷、edge case 處理。這才值得上最貴的 model,但通常一天也就跑幾次,不是主要成本來源。
做完這個分層,同樣的 workflow 成本大概能砍 5 到 8 倍。我自己測下來大概是這樣。
Model Router 不用多複雜
最簡單的做法:針對不同 workflow node 直接寫死 model,不要讓所有 node 共用同一個 config。大部分人嫌麻煩跳過這步,但花 30 分鐘設一次,之後每個月都省錢。
稍微進階一點的是讓 orchestrator 先判斷 task tier 再 route,但如果你的 workflow 邏輯夠清楚,其實寫死就夠了,不用過度工程化。
觀測只追三個數字
有人說做 observability 要上一整套 stack,Langfuse、Prometheus 全部到位。我覺得對大部分人來說這樣太重了,反而搞到半途而廢。
我只追三個:每日 token 用量(按 model 分開看)、平均 latency(latency 異常高代表在用貴的 model 做不需要的事)、error rate(free tier 過載的早期警示)。
用 Google Sheet 記就夠,至少讓你知道錢是在哪個 node 燒掉的。
大部分「成本爆炸」的原因都是 model 選錯,不是架構有問題。分層之後成本會變得可預測,這比去找一台更快的機器實際多了。
作者:AutoKitty