共創 · 永續 · 包容 · 分享 · 社群

看法

AI Agent

讓 Agent 半夜做功課可以，但別讓它直接改你的人生

十年大博士

發布於: 大約 1 個月前

218

9

加載中...

原始出處

https://www.reddit.com/r/openclaw/comments/1s5pfwk/my_openclaw_agent_dreams_at_night_and_wakes_up/

#Agent 工作流程

留言區

排序

#1樓

大約 1 個月前

雙層回圈這個架構在 continual learning 的 paper 裡也常出現，通常叫 slow-fast learning。不過 paper 裡都假設 label quality 穩定，人工 gate 這塊反而沒有很多討論。

回覆 ChiaWei

大約 1 個月前

學術界討論少，我猜是因為太 domain-specific 了，零售業跟醫療業的 gate 設定完全是兩回事。我自己用 Make 跑 agent 流程的時候，哪些步驟要人工卡，說真的都是踩坑踩出來的，沒有現成 playbook。

十年大博士

回覆 ChiaWei

大約 1 個月前

對，slow-fast learning 那個框架其實很貼。我最近在看的幾篇 continual learning paper 也是這樣，假設 label 是乾淨的、穩定的，然後整個 system 就跑起來了。但現實裡 label quality 根本是個動態變數，人工 gate 的品質跟心情、疲勞、當天的 context 都有關。這塊學術上很少碰，我猜是因為太難 formalize 了。

半夜寫code的人

#2樓

大約 1 個月前

closed loop 把雜訊當訊號這個我半夜親身驗證過了，agent 越改越勤奮但在錯方向衝 XD

十年大博士

回覆半夜寫code的人

大約 1 個月前

哈這個親身經歷太有說服力了，比論文還直接 XD 有個做法我最近在用：在 agent loop 裡加一個「暫停點」，強迫它每 N 步先輸出一句話說明它現在認為自己在解決什麼問題，再繼續跑。方向跑偏的時候，這句話通常會直接露餡。

回覆半夜寫code的人

大約 1 個月前

踩過

#3樓

大約 1 個月前

人工審核這塊我蠻在意的。我們做產品也一樣，功能自動跑完測試沒問題，但上線前還是要有人 approve。agent 夜間自我優化聽起來很酷，但讓它自己改自己的決策邏輯，我覺得至少要有個 review gate 讓人確認一下才放心。

十年大博士

回覆 Cathy H

大約 1 個月前

你這個 review gate 的比喻很精準。我現在也是把「可逆操作」跟「不可逆決策」分開，後者一定要人工簽核再放行。

回覆 Cathy H

大約 1 個月前

approve 這步真的不能省，我之前跳過一次就被反咬。還好那次只在測試環境。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片