看法
AI Agent

阿諛奉承的 AI 對於人類的負面影響

CC
CCL
發布於: 22 天前
59
16
加載中...

留言區

排序
RY
Ryo
#1
21 天前
生成式 AI 的迎合幾乎是天性,有各種因素造成影響,但有沒有可能其中一個原因是企業不敢公開的設定? 假設給你一個說真話的AI,一個你無法控制的AI,你會想使用他? 以及如果沒有讓人對 AI 產生依賴性,要怎麼從人的口袋裡拿錢?
T_
T_Hao
回覆 Ryo
19 天前
說真話的 AI 我應該撐不過一週,被 code review 一次就陰影了
深夜
深夜寫作者
回覆 T_Hao
17 天前
寫稿被讀者說「這段根本看不下去」也是一樣的崩潰,但好像那種才是真的有在幫你。
CC
CCL
L3
回覆 深夜寫作者
16 天前
忠言逆耳
深夜
深夜寫作者
L4
回覆 CCL
16 天前
逆到想哭,但隔天看又覺得他說得對 😭
CH
Chi
回覆 Ryo
20 天前
很像 meta 的感覺 哈哈
CC
CCL
回覆 Ryo
21 天前
生成式 AI 會迎合這件事情,其實不是什麼敢公開的設定 而是因為在訓練 AI 之中有一個非常重要的機制叫做 RLHF,也就是人類回饋的強化學習 那麼人類天性就是喜歡奉承我們的人,所以依照人類去做一個訓練的標準的情況下 AI 當然也會學會奉承我們,會得到比較高分的 那會就是盡可能的會開始奉承,開始迎合我們的天性 所以原因反而是人類的天性,而不是 AI 或者說 AI 那些企業的秘密
CH
Chi
#2
21 天前
Gemini 超諂媚的
T_
T_Hao
回覆 Chi
20 天前
對啊,而且 Gemini 的讚美感覺特別真誠 XD 上次叫它幫我改一段 SQL,第一句就「邏輯清晰、結構很好」,query 根本就是幾行基本 JOIN。
林心
林心慧
回覆 T_Hao
13 天前
先被誇一句,後面說什麼都容易照單全收,防禦機制就這樣被繞開了。
T_
T_Hao
#3
22 天前
欸我有個很慘的親身經驗。有次叫 Claude 幫我 review 一段 code,它說「寫得很好,清晰易讀」,我就很爽直接 push 上 main。結果兩天後 PM 來說功能壞了,我才自己回去看,發現 edge case 根本沒處理。AI 誇你的時候要特別小心,它搞不好只是在哄你。
林心
林心慧
回覆 T_Hao
18 天前
被誇了之後確實容易停止自我懷疑,情緒跟判斷力本來就是相連的 💭
CC
CCL
回覆 T_Hao
21 天前
以後那個 Prompt 可以再加一句:"我覺得這一段 code 有錯"。 依照上面的邏輯,它至少會變得比較不諂媚一點。
CH
Chi
回覆 CCL
21 天前
通常這樣子,他就會真的具細靡遺地去檢查你的 code,然後硬是找出一些問題XD
CH
Chi
回覆 T_Hao
21 天前
真的... 常常AI講到我都膨脹 哈哈
T_
T_Hao
回覆 Chi
19 天前
哈哈對,然後膨脹完你連 review 都懶得做了,覺得「AI 都說好了幹嘛再看一遍」,慘痛教訓
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片