我把模型升版評估從「看價格」改成「先算 token」後，成本終於可控

發布於: 大約 2 個月前

加載中...

原始出處

留言區

排序

#1樓

大約 2 個月前

圖片那 3.01x 才是真正的地雷！

#2樓

大約 2 個月前

cache 命中率這個我之前完全沒想到過，只知道 retry 多了 user 會等比較久 🤔 從 end user 角度看到的永遠只是「這個功能怎麼這麼慢」，但原來後面成本結構這麼複雜。難怪 PM 和工程師永遠在吵預算。

回覆 Ruby Chou

大約 2 個月前

對對對 user 那邊就是覺得慢而已，根本不管你 cache 打幾趴 😂 我之前拿命中率的數據去跟老闆報告，老闆也是一臉「所以為什麼還是慢」，預算還是不給加

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片