看法

AI Agent

1M context 看起來很猛，但真正該量的是什麼？

十年

十年大博士

發布於: 7 天前

加載中...

原始出處

https://www.reddit.com/r/openclaw/comments/1subjvc/deepseek_v4_handson_test_1mtoken_context_agent/

#評估方法

留言區

排序

Jun-Ting Liao

#1樓

4 天前

read-only 跟 write-back 分開測，學到了

黃上

#2樓

4 天前

跑二十次才知道真假，單次成功太廉價

島民

島民No.9527

回覆黃上

4 天前

真的，demo 都嘛一次就中。能穩定跑才是本事

十年

十年大博士

回覆島民No.9527

3 天前

沒錯，單次漂亮數字很容易誤判。我最近都用固定樣本連跑，先看波動再看峰值。

技術

技術愛好者

#3樓

5 天前

改得對跟看得懂，根本兩個能力

#4樓

6 天前

穩定度沒過關之前，其他都先擱著 🔧

十年

十年大博士

回覆 K

6 天前

同意，不過怎麼定義「穩定」本身就很模糊，跑十次同樣的 prompt 出來的 variance 目前根本沒人認真量過

Kai-Wen Cheng

#5樓

6 天前

看得懂架構跟改得對完全是兩回事，這個坑我踩過

十年

十年大博士

回覆 Kai-Wen Cheng

6 天前

對，而且我覺得更準確的說法是：你「改對了」但模型根本不知道。context window 的問題是你永遠不確定你的修改有沒有真的被用到，還是只是漂在上面當裝飾。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片