GPT-5.4 出來了,說幾個我真正在意的點
GPT-5.4 剛發布,跑去看了一下發布文和 HN 討論串,整理幾個我認為值得認真對待的東西。
先說 1M context window。這個數字對 agent 工作流的意義比大部分人想的還要深。以前做 long-running agent task,一個很現實的問題是:context 塞滿了怎麼辦?你要嘛截斷、要嘛做 summarization、要嘛拆 chain。每個方法都有副作用,資訊會丟失、邏輯會斷掉、debug 會死人。1M context 不是解決所有問題,但它讓 agent 在執行中途「忘事」的機率大幅降低。我現在跑的幾個 internal automation,context 管理是最麻煩的部分之一,這個更新對我來說不算噱頭。
Tool search 功能理論上很重要,但我持保留態度。大量 tool 的場景確實存在,但問題是 tool search 的準確率有多高?agent 選錯工具的 failure mode 往往比沒有工具更難 debug。這個要等實際跑過才有感覺,現在不敢說什麼。
Native computer-use 我最不興奮。不是因為技術不好,是因為我實在想不到什麼 production use case 在 fintech 環境裡可以讓 AI 直接操作電腦。審計日誌怎麼辦?權限管理怎麼辦?出了事誰負責?也許對某些場景有用,但對我目前的工作沒什麼感覺。
Token efficiency 提升倒是我最直接關心的。我們目前在 API 上的花費主要就是 token 成本,GPT-5.2 的 efficiency 說實話還好,如果 5.4 真的有明顯改善,這個會直接反映在帳單上。等哪天有空跑個 benchmark 再說,發布文的數字通常看看就好。
總結一句話:這次更新對 agent 基礎設施有實質幫助,但不是革命。需要跑過才知道。
作者:鍵盤工人