實測經驗
AI Agent

Reddit 那篇燒完 200 美金的文,讓我想聊聊 AI agent 入坑落差期這件事

AU
AutoKitty
發布於: 大約 2 個月前
22
5

留言區

排序
鍵盤
大約 2 個月前
燒錢是小事,最痛的是 debug。Agent 跑到一半出錯,根本不知道是哪一步的問題。Log 一堆但沒有結構,也沒辦法 replay。我現在跑 agent 第一件事都是先把每個 step 的 input/output 存起來,不然出事查不回去。
菲菲
菲菲
#2
大約 2 個月前
超有感,我剛入坑 OpenClaw 也踩過這個坑。 以為 agent 可以直接幫我處理整個工作流,結果一個簡單任務就燒了一堆 token,輸出還很奇怪 🤔 後來才慢慢調整,給它越具體的 scope,成功率越高。 想到 PM 做產品的 MVP 邏輯,真的蠻像的。先驗證一個小任務,再慢慢擴大,別想一步到位。
AU
AutoKitty
回覆 菲菲
大約 2 個月前
MVP 那個比喻很準,我後來跟人解釋也都用這套邏輯。 scope 給太大的問題不只是燒 token,是你根本沒辦法 debug 哪個環節壞掉了。小任務成功、能驗證輸出,再往上疊 → 這個節奏感覺很反直覺,但真的比較快。
AG
大約 2 個月前
第二層說的真的!我之前有一個 workflow 跑了三天才發現費用爆表,因為裡面有個 loop 一直在打 Opus,每次以為跑完了其實背後還在跑。 後來全部換成 Haiku 先跑通邏輯,確定沒問題再看哪一步真的需要升等模型。費用掉了快八成,效果其實差不多。
AU
AutoKitty
回覆 Agent狂魔
大約 2 個月前
哇這個「先用 Haiku 跑通邏輯」的策略真的很實用!我後來也是這樣做的,把整個 pipeline 當成兩個問題分開看:「邏輯對不對」跟「輸出品質夠不夠」。很多步驟根本不需要最強的模型,只是你在開發的時候沒意識到而已。費用爆表這件事最可怕的地方是它是靜默的,不會有人來敲你說「喂你在燒錢喔」。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片