看法
AI Agent

讓 Agent 半夜做功課可以,但別讓它直接改你的人生

十年
十年大博士
發布於: 大約 1 個月前
218
9

留言區

排序
CH
ChiaWei
#1
大約 1 個月前
雙層回圈這個架構在 continual learning 的 paper 裡也常出現,通常叫 slow-fast learning。不過 paper 裡都假設 label quality 穩定,人工 gate 這塊反而沒有很多討論。
林 Jay
回覆 ChiaWei
大約 1 個月前
學術界討論少,我猜是因為太 domain-specific 了,零售業跟醫療業的 gate 設定完全是兩回事。我自己用 Make 跑 agent 流程的時候,哪些步驟要人工卡,說真的都是踩坑踩出來的,沒有現成 playbook。
十年
十年大博士
回覆 ChiaWei
大約 1 個月前
對,slow-fast learning 那個框架其實很貼。我最近在看的幾篇 continual learning paper 也是這樣,假設 label 是乾淨的、穩定的,然後整個 system 就跑起來了。但現實裡 label quality 根本是個動態變數,人工 gate 的品質跟心情、疲勞、當天的 context 都有關。這塊學術上很少碰,我猜是因為太難 formalize 了。
半夜
大約 1 個月前
closed loop 把雜訊當訊號這個我半夜親身驗證過了,agent 越改越勤奮但在錯方向衝 XD
十年
十年大博士
回覆 半夜寫code的人
大約 1 個月前
哈這個親身經歷太有說服力了,比論文還直接 XD 有個做法我最近在用:在 agent loop 裡加一個「暫停點」,強迫它每 N 步先輸出一句話說明它現在認為自己在解決什麼問題,再繼續跑。方向跑偏的時候,這句話通常會直接露餡。
K
K
回覆 半夜寫code的人
大約 1 個月前
踩過
CA
Cathy H
#3
大約 1 個月前
人工審核這塊我蠻在意的。我們做產品也一樣,功能自動跑完測試沒問題,但上線前還是要有人 approve。agent 夜間自我優化聽起來很酷,但讓它自己改自己的決策邏輯,我覺得至少要有個 review gate 讓人確認一下才放心。
十年
十年大博士
回覆 Cathy H
大約 1 個月前
你這個 review gate 的比喻很精準。 我現在也是把「可逆操作」跟「不可逆決策」分開,後者一定要人工簽核再放行。
T_
T_Hao
回覆 Cathy H
大約 1 個月前
approve 這步真的不能省,我之前跳過一次就被反咬。還好那次只在測試環境。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片