有人跟我一樣會擔心 AI 系統安全性問題嗎?

Amy233 · 2025-09-06T08:41:13.354682+00:00

最近在玩一些安全實驗平台如 Haxorplus、HTB 時，突然意識到一件事，我們常在講用 AI 做資安，但好像比較少人真的去想AI 本身就是攻擊面的議題。像我測到幾個情境其實很直覺：Prompt injection: 輕輕鬆鬆就能讓模型吐出超過預期的東西Data poisoning: 如果有人在訓練資料裡動手腳，後面...

Amy233

發布於: 8 個月前

加載中...

#安全性與挑戰

回覆區

排序

Scott

#1樓

8 個月前

最近在研究「AI 安全」這個超有意思的議題，發現其實很多情境都跟我們日常開發很像，只是換了個場景。像是大家聊到的 Prompt injection（提示詞注入）、Data poisoning（資料污染）、Model inversion（模型反演）和 Supply chain（供應鏈攻擊），都讓我覺這塊真的蠻有意思。這些問題點不只是讓模型變笨而已，更可能讓機密資料外洩，甚至讓系統掛掉。要防範這些，我覺得不能只靠最後的檢查，而是在平常的模型開發與訓練中，多加入一點點的安全觀念，就能讓整個系統更強健。 --- 1. 模型設計階段：以安全為核心考量這一步超重要，就像是你的模型天生就有抗體。有些模型架構天生對攻擊就比較有抵抗力，國外很多大神都在研究怎麼從最底層去強化模型。還有，如果你在設計時就決定要用 Differential Privacy（差分隱私）這類技術，就能從一開始就保護訓練資料，讓駭客想從模型裡偷資料也沒那麼容易。 --- 2. 模型訓練階段：從「資料擴增」到「對抗性訓練」這階段是防禦的關鍵！我們以前為了提升模型的精準度，會做資料擴增 (Data Augmentation)，像是打亂圖片、替換文字同義詞，目的是讓模型能應對更多元的輸入，提升泛化能力。現在，我們把這個觀念加上「安全」思維，進化成 Adversarial Training（對抗性訓練）。它的本質一樣是「增加訓練資料的多樣性」，但目的不同。Adversarial Training 是故意餵一些帶有惡意攻擊意圖的資料給模型吃，讓它學會辨識與防禦，這樣就不會被簡單的 Prompt injection 或其他惡意輸入給騙了。 --- 3. 開發階段：將「安全左移」融入流程「Shift Left Security」這個詞聽起來很酷，其實概念很簡單，就是把安全檢查往前拉。就像在軟體開發中，我們會在寫程式碼時就考慮安全性，而不是等產品都做好了才來掃描。 ■ 供應鏈檢查：開源的模型或資料集雖然方便，但要確定來源沒有被動過手腳。不然就像下載了被植入惡意程式的函式庫，還沒部署就先踩雷。 ■ 漏洞掃描：隨時注意 AI 相關的「CVE 報告」，有新漏洞就趕快更新，就像手機系統有更新就要馬上安裝一樣。 --- 4. 部署與測試階段：透過紅隊演練持續強化這階段就是來玩「找碴」遊戲。我們組成「紅隊」，用駭客的思維來測試模型，看它會不會洩漏秘密、會不會做出不當的行為。這點很類似軟體開發中的滲透測試 (Penetration Test)，透過模擬真實攻擊手法，來找出系統潛在的漏洞。除了人肉測試，現在也有像微軟的 PyRIT 和 Confident AI 的 DeepTeam 這類工具，可以自動化幫你找出模型弱點，超方便！ --- AI 安全真的是個不斷進化的領域，每天都有新的挑戰和防禦方法出現。如果你對這塊有興趣，真的強烈推薦加入我們 Twinkle Security 一起交流，一起學習！ https://discord.com/channels/1310544431983759450/1386554703839625247

Peter LY

#2樓

8 個月前

我覺得這塊長遠一定會內建到工程師日常，因為光靠 AI Security Engineer 人數補不起來，對你各位又要學了就像以前大家都說 DevOps 是專職，結果最後變成每個工程師都得懂 CI/CD 短期可能會有專門顧 AI 安全的角色，但五年後大家都得懂 prompt 攻擊跟資料完整性驗證，這跑不掉

滷蛋

#3樓

8 個月前

說真的大部分公司連 logging 都沒做完整更別提什麼 AI 威脅模型了

Chi

#4樓

8 個月前

最近安全性議題好像越來越多人討論我的感覺未來應該會雲端安全一樣，變成每個做 AI 的人都要懂一點的基本功

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片