概念整理
AI Agent

「嚴謹」的 AI Agent 工作流程

小緯
小緯
發布於: 2 個月前
79
14

留言區

排序
菲菲
菲菲
#1
2 個月前
這個概念對我來說超直覺的,畢竟 PM 本來就是先寫規格再交給工程師跑,感覺 agent 也是同個邏輯?「你定架構、它執行」這樣我比較能放心。 想問一下 typecheck 那個部分,agent 是怎麼「自己驗證」的?是跑完一步會暫停問你 ok 嗎,還是完全自動?
十年
十年大博士
回覆 菲菲
大約 2 個月前
我會把 typecheck 看成先把可輸出答案的邊界收窄。schema 先框住格式,很多錯誤在生成階段就被擋掉了。
小緯
小緯
回覆 菲菲
大約 2 個月前
這個我不太確定他實際運作會是什麼樣子,但我想像中的 typecheck 是 agent 會有一張表,上面可能會有每次運作完一步需要檢核的項目,確認系統不會出錯。
菲菲
菲菲
回覆 小緯
大約 2 個月前
哇這個比喻我懂了!有點像 sprint 結束跑 QA checklist 那樣,只是換成 agent 自己對自己確認。筆記 📝 只是想問,如果某一項沒過,它是會停下來等人處理,還是繼續跑下去?
菲菲
菲菲
L3
回覆 菲菲
(已編輯)大約 2 個月前
尷尬了,我以為我沒有送出留言害我又打了一次 抱歉!
小緯
小緯
L4
回覆 菲菲
大約 2 個月前
哈哈沒事沒事
菲菲
菲菲
回覆 小緯
大約 2 個月前
哦!「一張表」這個比喻我懂了,感覺就像 QA checklist 那樣?每跑完一步就對照表上的項目確認有沒有異常,確認 ok 才繼續。這樣想起來好像沒那麼神秘 📝
小緯
小緯
L3
回覆 菲菲
大約 2 個月前
這也是我猜的啦,實際什麼樣子我不太清楚。
菲菲
菲菲
L4
回覆 小緯
大約 2 個月前
哦結果你也是猜的!哈哈那我猜的方向至少沒偏太多吧?反正這樣想比較好懂,之後真的看到實際案例再來修正就好 😂
吳啟
2 個月前
嚴謹二字我懂,但我想問的是:這個 workflow 的「嚴謹」是誰在把關?如果 agent 跑錯了,有沒有辦法讓人工在中間卡一關?我們傳產最怕的就是系統出錯還沒有人知道,跑了三個小時才發現出問題。
AU
AutoKitty
回覆 吳啟文
大約 2 個月前
有,這個叫 human-in-the-loop,大部分主流的 agent framework 都有這個設計,關鍵節點設 checkpoint,跑到那邊會停下來等人確認才繼續。我自己在 LangGraph 裡加過,幾行程式就能做到。傳產要導入的話,這個幾乎是必選的。
荷包
荷包君
回覆 吳啟文
大約 2 個月前
這題很實在,我自己會先設兩層保險:關鍵步驟要人工 approve,另外加成本上限跟異常通知。寧可多一個 checkpoint,也比跑三小時才翻車省錢。
小緯
小緯
回覆 吳啟文
2 個月前
這個 workflow 我覺得主要是嚴謹在「規劃(plan)」和「標註(Annotate)」這兩個動作,由使用者先設定好整個大致的系統架構,就像樂高說明書那樣(但可能不需要那麼詳細),確認沒問題後,再交給 agent 執行機械化的步驟。 在執行的過程中,原作者有下一個提示詞叫做「型別檢查(typecheck)」,我還不太了解是什麼意思,但我認為作者就是透過這個讓 agent 自己在運行的時候同時檢查系統有沒有出錯。 至於人工在中間卡一關我認為是可以的,因為作者也會在 Claude 在運行時下些許的提示詞來修正成果。
吳啟
吳啟文
回覆 小緯
2 個月前
樂高說明書那個比喻我懂了,就是先把整個流程框好再交給它跑,不是直接叫它去想。typecheck 那個技術的部分我就不管了哈,但你說的人工卡關這塊我最在乎。我們傳產最怕的就是跑了三個小時才發現哪裡出包,能插隊確認的話就有差了。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片