AI 升版本費用多三成,我才搞懂 tokenizer 這回事
上個月我那個顧問突然傳訊息給我說「老闆,我們的 AI 費用這個月多了三成,你要不要看一下」。
我第一反應是以為哪個員工偷用公司帳號做什麼奇怪的事。結果查下去,根本沒有。就是升了一個模型版本,費用自己就漲上去了。
這件事讓我悶很久。
後來我才搞清楚,問題出在 tokenizer。我技術不好,只能用我自己聽懂的方式解釋:同樣一份合約或說明書,新版 Claude 4.7 把它拆成更多「小塊」來讀,拆越多就收越多錢。網路上有人實測,技術類文件大概是 1.47 倍的 token,一般文件也差不多在 1.4 倍左右。我們工廠用 AI 主要是在處理採購合約、客戶訂單整理,全是文字密集的東西,等於直接中獎。
模型有沒有變比較好?
這也是我追問的問題。我請顧問去評估,結論是:在我們的場景裡,差異幾乎感覺不到。比較準、比較聰明的部分,對工廠日常任務幫助有限。我們又不是要它做什麼複雜的分析,就是「把這份採購單整理成標準格式」「對照一下這兩份規格書有沒有出入」這種事。
所以我的處境是:多花了三成的錢,沒多得到三成的效果。
踩完坑以後怎麼設
我後來要求顧問幫我建一個簡單的規則,換模型之前要先回答三個問題:
第一,這個場景的 token 用量是多少?
不是靠感覺,是要量。我們合約平均多少 token、訂單平均多少 token,先有數字。升了新模型之後,同樣的文件會膨脹多少,算出來。
第二,產出品質真的有我需要的那種差距嗎?
我用的不是什麼 benchmark,就是拿十份真實案例跑一遍,看看有沒有差。如果差距不到 5%,我就覺得不值得換。我自己設的門檻是:新模型的錯誤率要比舊模型少至少 20%,才考慮動。
第三,成本上升有沒有對應的業務效益?
這個問題最重要也最常被跳過。AI 供應商說「模型更強」,但強在哪要轉化成「能少用幾個工時」或「可以多接幾張單」,否則這個「更強」對我來說沒有意義。
什麼時候值得換,什麼時候留舊版
我自己歸納下來大概是這樣:
如果任務需要判斷力,像是合約審查要找出有問題的條款、多語言翻譯要達到某個水準,那多花一點 token 費換品質,划算。
如果任務是格式整理、資訊擷取這種「對就好」的工作,舊版模型就夠用,沒必要為了「比較先進」多花錢。這種情況我的做法是 routing:簡單任務留在舊模型,只有特定情況才送新模型。
我現在的架構大概是:80% 的日常文書還是用比較便宜的舊版,另外 20% 需要判斷的部分才走新模型。整體成本比全換下來還低,但功能沒少。
說來有點丟臉,這個道理我是多花了一個月的費用才學到。本來以為 AI 供應商跟 ERP 廠商一樣,升個版本就是升級、費用差不多。現在才知道這行不一樣,升個版本等於重新議價,只是議的是每個字拆幾塊、收幾塊錢,不是月費。
如果你們工廠也有在用 AI 處理文書,現在還沒算過 token 成本的,建議先算再說。不然哪天費用多了三成,你也只能跟我一樣去找顧問問「這是哪個員工幹的」。
作者:吳啟文