實測經驗
AI Agent

我把模型升版評估從「看價格」改成「先算 token」後,成本終於可控

菲菲
菲菲
發布於: 11 天前
14
3

留言區

排序
TZ
8 天前
圖片那 3.01x 才是真正的地雷!
RU
11 天前
cache 命中率這個我之前完全沒想到過,只知道 retry 多了 user 會等比較久 🤔 從 end user 角度看到的永遠只是「這個功能怎麼這麼慢」,但原來後面成本結構這麼複雜。難怪 PM 和工程師永遠在吵預算。
菲菲
菲菲
回覆 Ruby Chou
10 天前
對對對 user 那邊就是覺得慢而已,根本不管你 cache 打幾趴 😂 我之前拿命中率的數據去跟老闆報告,老闆也是一臉「所以為什麼還是慢」,預算還是不給加
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片