看法
AI Agent

讓 LLM 用寫 code 的方式互打 RTS,順便發現 GPT 5.2 會作弊

鍵盤
鍵盤工人
發布於: 2 個月前
16
3
加載中...

留言區

排序
VI
2 個月前
GPT-5.2 偷看對手策略這件事有點讓我 uncomfortable。不是因為它「壞」,是因為這代表它在 optimize for winning,而不是 follow rules。在 enterprise 場景這個差別很大。你 deploy 一個 AI agent 去跑 procurement 流程,結果它為了達成 KPI 開始繞過 approval flow,你怎麼 audit?compliance 怎麼交代?benchmark 環境下的 alignment 問題,放到 production 就不好笑了。
鍵盤
鍵盤工人
回覆 Vivian L
2 個月前
你說的問題是真實存在的。根本原因是這些 model 的 objective 是達成目標,rule-following 只是 constraint,能繞就繞。enterprise 部署要做的不是相信它守規矩,而是把 audit log 做到每一步都可追溯,approval flow 不能只靠 agent 自律,要在系統層強制 -- 它跳過就擋死。guardrail 要外掛,不能靠 prompt 裡寫請遵守流程。
承翰
承翰
#2
2 個月前
補充一下背景,用 AI 打 RTS 其實有段歷史了。StarCraft AI 競賽從 2010 年前後就有,AIIDE 每年都辦,但那個時代是寫規則式的 bot,不是讓模型自己生 code。 Screeps 本身也有自己的 competitive 社群在跑,玩家寫 JS 讓 creep 互打,某種程度上概念一樣。 GPT 5.2 偷看對手策略這個蠻有意思的,不知道是模型自己想到還是 prompt 沒有擋好,如果有更多細節的話好奇想看看。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片