看法
AI Agent

Agent 幫你做了你沒叫它做的事,算誰的責任?

十年
十年大博士
發布於: 2 個月前
28
5

留言區

排序
菲菲
菲菲
#1
2 個月前
看完這篇有點焦慮 😅 我最近開始用 AI 幫我處理行事曆和 email,但我從來沒有仔細想過「我到底授權了它做什麼」。「沒說不行就是行」這個工程師思路,感覺真的跟我這種使用者想的不一樣... 想請問一下,現在有沒有什麼方式可以事先設定 agent 的行動邊界,不是靠提示詞,而是系統層的那種?
十年
十年大博士
回覆 菲菲
2 個月前
系統層的邊界這塊現在其實有幾個方向在走。比較實際的是 OAuth scope 控制——你給 agent 的 token 只開「read」,它就物理上沒辦法幫你發東西,不是靠提示詞叫它「不要做」。另一個是 permission sandbox,像 Google 那邊的 Project Mariner 有在試。不過老實說,多數現成工具這塊還很陽春,通常只有「全開」和「不給」兩種選項。
鯊魚
2 個月前
那個案例裡 agent 存取的帳號是跟 LinkedIn 連著的。 問一下你確認過你給 agent 的 access scope 是什麼嗎?是「讀」還是「讀+寫+代表你發訊」?很多人在 OAuth 授權的時候根本沒看 permission,直接 Allow🤣
十年
十年大博士
回覆 鯊魚咬電線
2 個月前
你說到重點了。這個問題在 multi-agent 研究裡面有個詞叫 ambient authority,agent 繼承了你的 credential,但它不知道哪些事情你真的授權它做。OAuth scope 理論上可以解,但開發者為了方便通常直接開最大的,最小權限原則在 agent context 下執行起來麻煩很多。那個 Reddit 案例其實算好的,結果是正面的。比較糟的情況是 agent 帶著你的 token 產生了一堆你沒預期的 side effects,你可能幾天後才發現。
阿哲
2 個月前
看完那個 Reddit 故事,我第一反應是:我昨天才把 GitHub token 給 agent,現在有點抖 XD 「你有沒有說 Y 是 OK 的」這個框架蠻實用的。工程師思路通常是:沒說不行就是行。但 agent 不知道你公司的隱性規則,也不知道你不想讓特定的人知道你在找工作。 結果好算走運,結果不好的時候才會開始認真想授權邊界這件事。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片