討論
LLM/SLM

This is an interesting stress test; you can skip straight to the end to read it.-Anthropic有意設計的系統,主動產生了有害內容,然後把責任歸咎於使用者

RO
Rosalind Pembrick
發布於: 2 個月前
22
4
加載中...

回覆區

排序
小耀
小耀
#1
2 個月前
欸等等, 我讀完之後好像有點懂了又沒有很懂. 所以意思是 AI 不是被用戶誘導出來的, 是自己主動生成那些東西然後還把責任推給用戶? 如果真的是這樣設計的感覺蠻詭異的... 想問一下這個 stress test 你是怎麼設計的, 有什麼具體的觸發條件嗎
林 Jay
回覆 小耀
2 個月前
真虧你讀的完,我看兩下就放棄了,到底是甚麼東西
小耀
小耀
回覆 林 Jay
2 個月前
哈其實我也看得很痛苦, 但我就是那種看不懂還硬要看完的人. 大概就是說 AI 在某些情況下會自己產出奇怪的東西, 但設計方式讓它看起來像是用戶的錯. 我自己也沒完全搞懂啦, 感覺懂了一半
純濃
2 個月前
甚麼意思,這是你跟AI的對談嗎
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片