從聊天框到工作流:AI 六步驟建議
這週看到 HashiCorp 創辦人 Mitchell Hashimoto 寫了一篇他採用 AI 的完整歷程,我覺得這篇文章難得的是沒有過度吹捧也沒有無腦批評,只是記錄了他怎麼從懷疑走到全面使用,怎麼從效率下降走到無法回頭。
Mitchell 把整個過程拆成六個步驟,每一步都對應到他遇到的具體瓶頸和解法,我覺得這個框架對於想認真把 AI 融入工作流的人來說,非常實用,這邊介紹給大家。
Step 1:放棄聊天框
Mitchell 第一個建議是直接放棄 ChatGPT、Gemini 這類純聊天介面,改用有執行能力的 Agent。他的理由很務實:聊天框只能靠訓練資料猜答案,然後你得不斷複製貼上程式碼、終端機輸出來回校正,根本沒有效率。
他提到自己第一次驚豔是把 Zed 的 command palette 截圖丟進 Gemini,要它用 SwiftUI 重現,結果幾秒內就做出來了,而且品質好到幾乎沒改就進了 Ghostty。但這種綠地專案的成功很難複製到實際的 brownfield 專案,因此他後來改用 Claude Code 這類能讀檔案、執行程式、發 HTTP 請求的 Agent。
這一步的核心是換工具,從對話框換成有手腳的 Agent,才能真的把事情做完。
Step 2:複製你自己的工作
Mitchell 開始用 Claude Code 之後並不順利,他覺得每次結果都要大幅修改,根本比自己做還慢。但他沒有放棄,而是強迫自己做兩次工作:先手動完成 commit,再用 Agent 重現一模一樣的結果。
這個過程很痛苦,但他因此從第一原則發現了幾個關鍵技巧:
把任務拆成小而清楚的 session,不要一次要 Agent「畫一隻貓頭鷹」
如果需求模糊,就分成「規劃 session」和「執行 session」
給 Agent 驗證自己的方法,它通常能自己修 bug 和防止 regression
更重要的是,他開始知道 Agent 擅長什麼、不擅長什麼,以及什麼時候不該用 Agent。這讓他進入「不比以前慢」的狀態,雖然還沒更快,但已經夠他願意繼續用下去。
Step 3:下班前開 Agent
Mitchell 接著試了一個新模式:每天最後 30 分鐘留給 Agent,讓它在你下班或睡覺時跑。他的假設是,如果能在你無法工作的時間推進事情,那就是純賺的效率。
他發現有幾類任務特別適合這個時段:
深度研究 session:例如找出特定語言、特定授權的所有套件,並產出每個套件的優缺點、開發活躍度、社群評價等多頁報告
平行測試模糊想法:讓多個 Agent 同時試不同方向,隔天早上看結果來找出未知的未知
Issue 和 PR 的分類與審查:用
ghCLI 讓 Agent 批次產生報告,但不准它直接回覆,只當成隔天的工作指引
Mitchell 強調他不會讓 Agent 整夜跑迴圈,通常半小時內就結束,但這些結果讓他隔天早上有個「暖啟動」,比以前更快進入狀態。
Step 4:外包那些穩贏的任務
到這一步,Mitchell 已經很清楚哪些任務 Agent 幾乎不會出錯,因此他開始把那些「slam dunks」全部丟給 Agent,然後自己去做別的事。
具體做法是:每天早上看前一晚的 triage 結果,手動篩出 Agent 肯定做得好的 issue,然後讓它一個一個跑。同時,他自己進入深度工作模式,做自己想做或必須做的事。
關鍵是關掉 Agent 的桌面通知,不讓 Agent 打斷你,而是你在自然休息時主動去看它的進度。這樣才能保持專注,不會頻繁切換 context。
Mitchell 認為這個做法可以平衡 Anthropic 那篇技能形成論文的隱憂:你把部分任務外包給 Agent,但同時仍在手動任務上持續累積技能。
他說到這一步時已經進入「回不去」的狀態,不只是效率提升,更重要的是他現在可以把時間花在他真正喜歡的任務上。
Step 5:工程化驗證機制
Mitchell 稱這一步為「harness engineering」,意思是當你發現 Agent 犯錯,就花時間做一套機制讓它以後不會再犯。
他提出兩種做法:
更好的隱性提示(AGENTS.md):如果 Agent 一直跑錯指令或用錯 API,就在 AGENTS.md 裡寫清楚規則,例如 Ghostty 的 AGENTS.md,每一行都對應到一個曾經的壞行為,加了之後幾乎完全解決
實際寫程式化工具:例如寫 script 讓 Agent 可以自動截圖、跑篩選過的測試等,再配合 AGENTS.md 告訴它這些工具存在
這一步的核心是把 Agent 的錯誤轉化成系統性的防護,讓它能自動驗證自己做對還是做錯。
Step 6:隨時保持 Agent 運行
Mitchell 現在的目標是隨時讓一個 Agent 在背景跑,如果沒有 Agent 在跑,他就會問自己「現在有什麼是 Agent 可以幫我做的嗎?」
他特別喜歡用 Amp 的 deep mode(本質上是 GPT-5.2-Codex),一個小改動可能要跑 30 分鐘以上,但結果通常很好。
他強調自己目前不想同時跑多個 Agent,一個就夠了,這樣能在深度工作和看顧 Agent 之間保持平衡。他也說這個目標還在進行中,目前一天大概只有 10-20% 的時間真的有 Agent 在背景跑,但他正在努力提高這個比例。
重點是不為了跑而跑,而是確保每個任務都是真正有幫助的。
我的觀察
Mitchell 這篇文章最有價值的地方,我覺得是它示範了一種「刻意練習」的心態,不只是用用看然後說好或不好, 而是強迫自己在效率下降的時候繼續做、重複做、反思做, 直到找到真正的使用模式。
Step 1 到 Step 6 是一條從工具切換、到技能養成、到流程優化、最後到系統化的路徑,我自己這一年多嘗試下來也有一樣的體悟,效率提升是需要投入、反覆試錯,以及系統化思考的。
作者:Chi