單月五億美元的 AI 費用
最近在整理一份給客戶的 AI 導入檢查清單,剛好看到 Simon Willison 匯整的數字:Anthropic 的年化收入從 2 月的 140 億美元,4 月 300 億,到 5 月已經到 470 億。更具體的是,文章裡提到企業端曾出現單月 5 億美元的模型使用費。
這個數字讓我重新想了一遍:為什麼大多數團隊的 AI 成本都會估錯?
答案通常不是定價不透明,而是使用行為根本沒辦法在導入前預測。傳統 SaaS 是按席次算的,AI 是按 token 算的,而 token 消耗跟 prompt 設計、對話輪次、場景複雜度都有直接關係。同樣是「請 AI 幫忙寫報告」,一個設計不好的 prompt 可能比設計好的貴 10 倍,不是誇張,是實際量測過的結果。
我自己觀察下來,第一個月的費用幾乎沒有參考性。使用者在探索期,query 量和 prompt 長度都不穩定,真正的使用模式要等到第二、第三個月才會成形。如果你的老闆在第一個月看到費用很低就鬆一口氣,那個才是危險時刻。
實際控費的三個動作
先做使用情境盤點,把任務分層。不是每個功能都需要最貴的模型,有些場景用 Haiku 或類似的輕量模型差不到哪裡。我在一個客戶那邊,把內部文件摘要任務從比較貴的模型換掉之後,月費少了將近 60%,準確率沒有明顯下降。
一定要在導入第一天就設硬性 quota。大部分平台都有使用量上限的機制,但很多 IT 部門預設不開,等費用超標才發現。這個要在 go-live 之前就設定好,不是等出問題才補。建議設兩層:每日告警閾值 + 月度硬上限,前者給工程師看,後者給財務知道。
建立費用的可視化,但要是工程師會看的那種,不是給 CEO 看的那種。我通常會建議做到:按功能分組的每日費用統計、單一 user 的異常流量偵測、以及超出均值兩倍時的即時通知。這樣有問題三天內會知道,不是等月底帳單寄來。
費用以外的問題
費用有數字可以追,反而還好控。真正難的是治理。
員工自己辦 API key、自己接服務、自己把公司資料丟進去——IT 完全不知道。這是我幾乎每個客戶導入時都會碰到的情況。等到公司決定「正式導入」的時候,地下 AI 已經跑了半年,資料早就不知道傳去哪了。
這不是紀律問題,是工具問題。如果公司沒有提供夠順手的官方入口,員工就會自己找。所以導入的第一步,通常不是選工具,而是先摸清楚員工現在在用什麼。了解現況,才能設計出真的有人遵守的治理規則。
成本問題和治理問題本質上是同一件事:都是在跑在前面,不是事後補洞。那個單月 5 億美元的案例,我不知道細節,但如果是我,我會想知道他們是在第幾週才發現的。
如果有人有大規模導入的實際數據或做法,蠻想交流的。multi-agent 場景下的成本預測我還沒有好答案。
作者:承翰