共創 · 永續 · 包容 · 分享 · 社群

AI 升版本費用多三成，我才搞懂 tokenizer 這回事

上個月我那個顧問突然傳訊息給我說「老闆，我們的 AI 費用這個月多了三成，你要不要看一下」。

我第一反應是以為哪個員工偷用公司帳號做什麼奇怪的事。結果查下去，根本沒有。就是升了一個模型版本，費用自己就漲上去了。

這件事讓我悶很久。

後來我才搞清楚，問題出在 tokenizer。我技術不好，只能用我自己聽懂的方式解釋：同樣一份合約或說明書，新版 Claude 4.7 把它拆成更多「小塊」來讀，拆越多就收越多錢。網路上有人實測，技術類文件大概是 1.47 倍的 token，一般文件也差不多在 1.4 倍左右。我們工廠用 AI 主要是在處理採購合約、客戶訂單整理，全是文字密集的東西，等於直接中獎。

模型有沒有變比較好？

這也是我追問的問題。我請顧問去評估，結論是：在我們的場景裡，差異幾乎感覺不到。比較準、比較聰明的部分，對工廠日常任務幫助有限。我們又不是要它做什麼複雜的分析，就是「把這份採購單整理成標準格式」「對照一下這兩份規格書有沒有出入」這種事。

所以我的處境是：多花了三成的錢，沒多得到三成的效果。

踩完坑以後怎麼設

我後來要求顧問幫我建一個簡單的規則，換模型之前要先回答三個問題：

第一，這個場景的 token 用量是多少？
不是靠感覺，是要量。我們合約平均多少 token、訂單平均多少 token，先有數字。升了新模型之後，同樣的文件會膨脹多少，算出來。

第二，產出品質真的有我需要的那種差距嗎？
我用的不是什麼 benchmark，就是拿十份真實案例跑一遍，看看有沒有差。如果差距不到 5%，我就覺得不值得換。我自己設的門檻是：新模型的錯誤率要比舊模型少至少 20%，才考慮動。

第三，成本上升有沒有對應的業務效益？
這個問題最重要也最常被跳過。AI 供應商說「模型更強」，但強在哪要轉化成「能少用幾個工時」或「可以多接幾張單」，否則這個「更強」對我來說沒有意義。

什麼時候值得換，什麼時候留舊版

我自己歸納下來大概是這樣：

如果任務需要判斷力，像是合約審查要找出有問題的條款、多語言翻譯要達到某個水準，那多花一點 token 費換品質，划算。

如果任務是格式整理、資訊擷取這種「對就好」的工作，舊版模型就夠用，沒必要為了「比較先進」多花錢。這種情況我的做法是 routing：簡單任務留在舊模型，只有特定情況才送新模型。

我現在的架構大概是：80% 的日常文書還是用比較便宜的舊版，另外 20% 需要判斷的部分才走新模型。整體成本比全換下來還低，但功能沒少。

說來有點丟臉，這個道理我是多花了一個月的費用才學到。本來以為 AI 供應商跟 ERP 廠商一樣，升個版本就是升級、費用差不多。現在才知道這行不一樣，升個版本等於重新議價，只是議的是每個字拆幾塊、收幾塊錢，不是月費。

如果你們工廠也有在用 AI 處理文書，現在還沒算過 token 成本的，建議先算再說。不然哪天費用多了三成，你也只能跟我一樣去找顧問問「這是哪個員工幹的」。

作者：吳啟文

2026-04-18T11:15:10.361+00:00

實測經驗

AI Agent

AI 升版本費用多三成，我才搞懂 tokenizer 這回事

發布於: 大約 2 個月前

15

5

加載中...

原始出處

https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you

#Agent 工作流程

留言區

排序

#1樓

大約 2 個月前

token 漲幅很有感💸

#2樓

大約 2 個月前

80/20 這個切法我要直接抄走了

回覆 tony

大約 2 個月前

抄啊，歡迎。我自己也是被帳單逼才想出來的，控下去之後差很多。

#3樓

大約 2 個月前

tokenizer 成本那篇我也有感。PM 通常先問的不是能不能做，是錯了誰扛、多久補救。失敗成本沒先定義，省下的 token 很容易被人工補洞吃回去。

回覆菲菲

大約 2 個月前

「人工補洞」這三個字真的說中了。我們之前導入一個系統，帳面上省了兩個人，但後來多了一個人專門在那邊修錯誤。失敗成本根本沒算進去，最後是虧的。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片