實測經驗
AI Agent

養龍蝦的三層流程:Agent、Skill、Workflow

CH
Chi
發布於: 大約 1 個月前
861
21
加載中...

留言區

排序
KE
Kevin
#1
大約 1 個月前
我有點不確定怎麼判斷「Agent 已經夠穩可以寫成 Skill 了」,是有什麼指標可以參考,還是跑一段時間自然就知道了?
離線
大約 1 個月前
你不需要盯著它的時候就穩了。還在追 log 或者手動 retry 就繼續養。
AU
AutoKitty
回覆 Kevin
大約 1 個月前
我自己的判斷點是:有沒有在其他 project 想複製它。有這個念頭的時候,基本上代表它的邊界已經夠清楚了。(如果還在頻繁改,你也不會想複製,複製了反而是麻煩)
CH
Chi
回覆 Kevin
大約 1 個月前
一段時間都不需要變動,很穩定執行那就可以考慮,如果很常會因為狀況不同或是出錯要改變,就保留彈性用 Skill
KE
Kevin
回覆 Chi
大約 1 個月前
喔這樣就比較清楚了,所以判斷標準不是跑了多久,是看改動頻率?我自己那個爬資料的流程就還沒到,每次格式不一樣就得調一次,看來還要繼續觀察。
CH
Chi
L3
回覆 Kevin
大約 1 個月前
那還是在等等吧,做了workflow 就沒有 skill 家個 prompt 那麼好調整了
KE
Kevin
L4
回覆 Chi
大約 1 個月前
好,先忍住不動。我那個爬的格式根本沒規律,每個網站長不一樣,要穩定感覺還要一段時間,哈。
咖啡
大約 1 個月前
Workflow 太早上反而麻煩,這個感受很真實。之前有個同事一上來就想把 Agent 寫成完整 pipeline,debug 三個星期才拆掉重來。先跑 Agent 搞清楚邊界,再說其他的。
LU
Lulu
回覆 咖啡驅動開發
大約 1 個月前
三週換來把 edge case 摸清楚,其實蠻值得。等需求波動比較穩,再抽成 Skill 或 Workflow 會省很多反覆重做。
CH
Chi
回覆 咖啡驅動開發
大約 1 個月前
哈哈是的,為了省錢上 workflow 結果得不償失,損失一堆時間
咖啡
大約 1 個月前
換個說法:省 API fee 省出三個星期的 engineering time,這筆帳只要算一次就會笑死 ☕
鯊魚
大約 1 個月前
從滲透測試的角度,我蠻推 Workflow 的,給 LLM 的決策空間越小,被 prompt injection 的機會就越少。
HE
Hector19
回覆 鯊魚咬電線
大約 1 個月前
自動化玩家也超有感,我的 side project workflow 跑了幾個月沒出什麼奇怪問題,agent 那塊偶爾還是會搞出一些你沒預期的操作 😂
CH
Chi
回覆 鯊魚咬電線
大約 1 個月前
是呀,Workflow 下 LLM 需要判斷的空間就少很多,不容易出錯, 也能減少被攻擊的機會
鯊魚
鯊魚咬電線
回覆 Chi
大約 1 個月前
對,說穿了就是 attack surface 的問題。決策點越少,要 audit 的範圍就越小,出事了也比較好查。
鄭家
大約 1 個月前
淺顯易懂,謝謝說明
鯊魚
鯊魚咬電線
回覆 鄭家騰
大約 1 個月前
真的,如果有在考慮實作,Agent 那層能用的工具記得最小權限原則,能限就限。給太多 autonomy 出事了很難 trace。
CH
Chi
回覆 鄭家騰
大約 1 個月前
感謝 :)
歪理
大約 1 個月前
目前看到把Skill用途和目標解釋得最淺顯並做出實際應用上比較最好的一篇
鯊魚
鯊魚咬電線
回覆 歪理蔡
大約 1 個月前
同感,三層職責分清楚很難得,之後做安全審查也好下手。
CH
Chi
回覆 歪理蔡
大約 1 個月前
感謝 :)
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片