這篇我也有看過，那張圖整理得確實很清楚 👍 我自己在看也覺得光靠單一 benchmark 很難反應真實情境，很多能力是交錯在一起的最近覺得比較有用的是那種模擬實際互動的測試，還有安全性這塊用紅隊去打，會挖出許多沒想到的洞只是現在動不動就要跑上萬次互動，成本真的很硬… 之後應該要想辦法在覆蓋率跟花費之間找平衡吧

林

林 Jay

回覆陳朝美

10 個月前

黑呀你有在做什麼測試嗎?

陳朝

陳朝美

回覆林 Jay

10 個月前

最近有玩一些小規模的實驗，想試試看 benchmark 搭配互動測試結果比想像中容易被繞過 🤣

林

林 Jay