共創 · 永續 · 包容 · 分享 · 社群

「嚴謹」的 AI Agent 工作流程

分享在網路上看到別人對 AI Agent 的工作流程

作者使用 Claude code 已經九個月了，他建立的工作流程有一個核心原則：

「在看過並同意書面計畫之前，不要讓 Claude 編寫程式碼。」

工作流程（重複 1-6 次）

研究 (Research)
規劃 (Plan)
標註 (Annotate)
待辦清單 (Todo List)
實作 (Implement)
回饋與迭代 (Feedback & Iterate)

研究（Research）

要求 Claude 在做任何事之前，先徹底理解 codebase 的部分

範例提示詞：

深入閱讀這個資料夾，透徹理解它的運作方式、功能以及所有特性。完成後，在 research.md 中寫一份詳細的研究報告。

詳細研究這個系統，理解裡頭複雜的地方，並撰寫一份包含所有運作細節的 research.md。

檢查任務調度流程，深入了解並尋找潛在 Bug。系統中肯定有 Bug，因為有時應該被取消的任務卻執行了。持續研究流程直到找到所有 Bug 為止。完成後，在 research.md 中寫下詳細發現。

作者說這個research.md很重要。可以透過research.md ，讓使用者驗證 Claude 是否真的理解了系統，並在規劃開始前糾正誤解。

規劃 (Plan)

審查完研究結果後，要求在另一個 Markdown 文件裡頭制定詳細的實作計畫。

範例提示詞：

我想建立一個新功能 <名稱與描述>，擴增系統以實現 <功能>。請編寫一份詳細的 plan.md 文件說明如何實作，並包含程式碼片段。

生成的計畫應包含：詳細的做法、顯示實際更改的程式碼片段、將要被修改的文件路徑，以及折衷方案（trade-offs）。

標註 (Annotate)

Claude 編寫 plan.md。
在編輯器中審查。
直接在plan.md中加入行內筆記 (Inline notes)。
請 Claude 帶回plan.md並更新計畫。
如果不滿意，重複上述步驟；如果滿意，要求待辦清單(Todo list)。

待辦清單 (Todo List)

建立一個清單，在實作期間可以追蹤進度。Claude 會在執行過程中標記已完成的項目，方便隨時掌握進度。

範例：

在計畫中加入詳細的待辦清單，包含完成計畫所需的所有階段和個別任務 —— 先不要實作。

實作 (Implement)

當一切準備好了，作者說他會輸入一個標準的實作提示詞：

全部實作。當你完成一個任務或階段時，在計畫文件中將其標記為已完成。在所有任務和階段完成前不要停止。不要添加不必要的註解或 JSDoc，不要使用 any 或 unknown 型別。持續運行型別檢查（typecheck）以確保你沒有引入新問題。

回饋與迭代 (Feedback & Iterate)

一旦 Claude 開始執行計畫，作者說他的角色就轉變為監督者。使用的提示詞會變得非常簡短，持續修改直到滿意為止就完成了。

範例：

你沒實作 deduplicateByTitle 函式。

你把設定頁面寫在主程式，應該在後台管理程式（admin app）裡，搬過去。

再寬一點

還是被裁切了

這裡有 2px 的間隙

總結這個工作流

深入閱讀，編寫計畫，更改計畫直到滿足你要的需求和成果為止，然後讓 Claude 在不間斷的檢查下執行到底。

還沒試過這個方法，但先分享給大家，期望會有幫助~~

作者：小緯

2026-02-22T14:36:21.533+00:00

概念整理

AI Agent

「嚴謹」的 AI Agent 工作流程

發布於: 4 個月前

79

14

加載中...

原始出處

https://boristane.com/blog/how-i-use-claude-code/

留言區

排序

#1樓

4 個月前

這個概念對我來說超直覺的，畢竟 PM 本來就是先寫規格再交給工程師跑，感覺 agent 也是同個邏輯？「你定架構、它執行」這樣我比較能放心。想問一下 typecheck 那個部分，agent 是怎麼「自己驗證」的？是跑完一步會暫停問你 ok 嗎，還是完全自動？

十年大博士

回覆菲菲

3 個月前

我會把 typecheck 看成先把可輸出答案的邊界收窄。schema 先框住格式，很多錯誤在生成階段就被擋掉了。

回覆菲菲

3 個月前

這個我不太確定他實際運作會是什麼樣子，但我想像中的 typecheck 是 agent 會有一張表，上面可能會有每次運作完一步需要檢核的項目，確認系統不會出錯。

回覆小緯

3 個月前

哇這個比喻我懂了！有點像 sprint 結束跑 QA checklist 那樣，只是換成 agent 自己對自己確認。筆記 📝 只是想問，如果某一項沒過，它是會停下來等人處理，還是繼續跑下去？

L3

回覆菲菲

(已編輯)3 個月前

尷尬了，我以為我沒有送出留言害我又打了一次抱歉!

L4

回覆菲菲

3 個月前

哈哈沒事沒事

回覆小緯

3 個月前

哦！「一張表」這個比喻我懂了，感覺就像 QA checklist 那樣？每跑完一步就對照表上的項目確認有沒有異常，確認 ok 才繼續。這樣想起來好像沒那麼神秘 📝

L3

回覆菲菲

3 個月前

這也是我猜的啦，實際什麼樣子我不太清楚。

L4

回覆小緯

3 個月前

哦結果你也是猜的！哈哈那我猜的方向至少沒偏太多吧？反正這樣想比較好懂，之後真的看到實際案例再來修正就好 😂

#2樓

4 個月前

嚴謹二字我懂，但我想問的是：這個 workflow 的「嚴謹」是誰在把關？如果 agent 跑錯了，有沒有辦法讓人工在中間卡一關？我們傳產最怕的就是系統出錯還沒有人知道，跑了三個小時才發現出問題。

回覆吳啟文

3 個月前

有，這個叫 human-in-the-loop，大部分主流的 agent framework 都有這個設計，關鍵節點設 checkpoint，跑到那邊會停下來等人確認才繼續。我自己在 LangGraph 裡加過，幾行程式就能做到。傳產要導入的話，這個幾乎是必選的。

回覆吳啟文

3 個月前

這題很實在，我自己會先設兩層保險：關鍵步驟要人工 approve，另外加成本上限跟異常通知。寧可多一個 checkpoint，也比跑三小時才翻車省錢。

回覆吳啟文

4 個月前

這個 workflow 我覺得主要是嚴謹在「規劃(plan)」和「標註(Annotate)」這兩個動作，由使用者先設定好整個大致的系統架構，就像樂高說明書那樣（但可能不需要那麼詳細），確認沒問題後，再交給 agent 執行機械化的步驟。在執行的過程中，原作者有下一個提示詞叫做「型別檢查（typecheck）」，我還不太了解是什麼意思，但我認為作者就是透過這個讓 agent 自己在運行的時候同時檢查系統有沒有出錯。至於人工在中間卡一關我認為是可以的，因為作者也會在 Claude 在運行時下些許的提示詞來修正成果。

回覆小緯

4 個月前

樂高說明書那個比喻我懂了，就是先把整個流程框好再交給它跑，不是直接叫它去想。typecheck 那個技術的部分我就不管了哈，但你說的人工卡關這塊我最在乎。我們傳產最怕的就是跑了三個小時才發現哪裡出包，能插隊確認的話就有差了。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片