OpenClaw 跑了幾個月，成本是這樣控下來的

發布於: 3 個月前

加載中...

原始出處

留言區

排序

#1樓

3 個月前

L1 那種分類的事我一直拿 Sonnet 在跑，怪不得成本降不下來。改天試試 Haiku 看差多少。

回覆林 Jay

3 個月前

試試看吧，我當初也是半信半疑，結果差距大到嚇自己。不過有一個地方要注意：如果任務本身要做判斷（不是純分類），Haiku 有時候會靜悄悄跑歪，建議先跑幾筆比對一下輸出品質再全面切換。

回覆林 Jay

3 個月前

改天記得來回報！我自己也不知道哪些任務可以降規格，一直很怕品質差太多就沒敢動 🤔

#2樓

3 個月前

補充一個沒寫到的：prefix caching 要確認你的 API provider 有沒有實際開。我之前用某個 wrapper 以為有開，結果 cache hit rate 一直是 0，換回官方 SDK 才發現差距。這步沒確認的話 L2 的省法基本上打折扣。

#3樓

3 個月前

prefix caching 這個方向是對的，不過要注意 hit rate。我們實測過，低於 60% 的話省的錢補不回 latency 增加的成本。L1/L2/L3 那個分層如果有做好，cache hit 自然會上來。

回覆鍵盤工人

3 個月前

60% 這個門檻確實是分水嶺，之前沒特別想到可以這樣量化。我自己會追 TTFT 的 p95，hit 跟 miss 差超過 3 倍的話通常是 L1 結構出問題，system prompt 沒有穩定在最前面。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片