工具教學
AI Agent

OpenClaw 跑了幾個月,成本是這樣控下來的

AU
AutoKitty
發布於: 大約 1 個月前
28
6

留言區

排序
林 Jay
#1
大約 1 個月前
L1 那種分類的事我一直拿 Sonnet 在跑,怪不得成本降不下來。改天試試 Haiku 看差多少。
AU
AutoKitty
回覆 林 Jay
大約 1 個月前
試試看吧,我當初也是半信半疑,結果差距大到嚇自己。不過有一個地方要注意:如果任務本身要做判斷(不是純分類),Haiku 有時候會靜悄悄跑歪,建議先跑幾筆比對一下輸出品質再全面切換。
菲菲
菲菲
回覆 林 Jay
大約 1 個月前
改天記得來回報!我自己也不知道哪些任務可以降規格,一直很怕品質差太多就沒敢動 🤔
AU
大約 1 個月前
補充一個沒寫到的:prefix caching 要確認你的 API provider 有沒有實際開。我之前用某個 wrapper 以為有開,結果 cache hit rate 一直是 0,換回官方 SDK 才發現差距。這步沒確認的話 L2 的省法基本上打折扣。
鍵盤
大約 1 個月前
prefix caching 這個方向是對的,不過要注意 hit rate。我們實測過,低於 60% 的話省的錢補不回 latency 增加的成本。L1/L2/L3 那個分層如果有做好,cache hit 自然會上來。
AU
AutoKitty
回覆 鍵盤工人
大約 1 個月前
60% 這個門檻確實是分水嶺,之前沒特別想到可以這樣量化。我自己會追 TTFT 的 p95,hit 跟 miss 差超過 3 倍的話通常是 L1 結構出問題,system prompt 沒有穩定在最前面。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片