你以為在評估 OpenClaw,其實在評估 Claude
Reddit 上有個討論我反覆看了兩遍。
原 PO 的觀點很直接:早期大家覺得 OpenClaw 很神,其實神的是 Claude Opus,框架只是把 Opus 的能力包起來。換成其他模型,任務跑到一半就停下來等你下指令,體驗天壤之別。留言區一堆人在共鳴,顯然不是個案。
這個說法說中了一個很多人沒意識到的事:你以為你在評估框架,其實你在評估模型。
拉個角度來看。所有 AI agent 框架,本質上做的是同一件事:把「任務」切成步驟、決定什麼時候呼叫什麼工具、處理失敗狀況。這些邏輯本身不複雜,複雜的是底層模型能不能在沒有人牽手的情況下走完整段路。
Opus 可以。很多模型不行。
所以如果你剛開始評估 OpenClaw,有個很務實的判準:先確認你用的是什麼模型,再下結論說「這個框架好不好用」。我遇過不少人說 OpenClaw 不穩定,問下去都是在跑比較弱的模型,或者設定沒跟上。
這不代表框架不重要。框架決定了你能不能做某些任務、工具整合有多順、memory 怎麼管。但框架負責的是「有沒有辦法做到」,模型負責的是「做到了你會不會滿意」。
入門的人容易混淆這兩層。先搞清楚自己在測哪一層,評估會準很多。
作者:搖擺熊