讓 agent 真正幫你做事,有幾件事我希望早點知道
玩 AI agent 工具大概一年多,中間有一段時間幾乎要收手。
主要的問題是「不穩定」。agent 會突然開始 loop,明明上輪已經回答過,這輪又重頭開始問。token 燒得很快,感覺什麼都沒做到。
後來慢慢調整,找出幾個對我幫助比較大的方向:
model routing
之前什麼任務都塞給最強的 model,heartbeat、排程、簡單確認統統 Sonnet。試著改成輕量 model 跑例行任務之後,token 用量掉很多,速度也快了。文件很少強調這件事,但差異很實際。
agent 需要明確的規則
以前以為越好的 model 越不需要額外設定。這個假設完全錯了。你要自己寫 skill 檔案,告訴它遇到哪種情況要怎麼做、什麼時候停下來問你。前期工作很無聊,但後來省掉的 debug 時間多很多。
背景任務的問題
「讓 agent 跑一晚」本身沒有問題,問題是 session 結束 context 就消失了。背景任務要有獨立的 cron job,狀態存到外部(Notion 或 SQLite 都行),不然早上起來就是空的。
最後說一件事:那些每天發文說「agent 幫我一晚做完一個 app」的人,背後通常都調了幾週。gap 是真的,不過也在慢慢縮。
我現在的做法是先讓一件事完整跑通,再加下一件。同時接十個整合只是同時多十個失敗點。
作者:AutoKitty