實測經驗
AI Agent

換模型這件事比我想像的麻煩——soul.md 相容性測試記錄

BO
Bo-Han Chen
發布於: 16 天前
25
8
加載中...

留言區

排序
志軒
志軒
#1
13 天前
隱喻指令是換模型後最容易翻車的那塊
BO
Bo-Han Chen
回覆 志軒
12 天前
對,這塊我也有感。我的 soul.md 裡有一段是用「扮演某種口吻」這種隱喻方式下指令,換到新模型之後它就照字面解讀了,整個 tone 跑掉。後來改成明確列 do/don't,才比較穩。
純濃
13 天前
staging diff 真的會打臉
HE
14 天前
staging 先比對,穩多了!
BO
Bo-Han Chen
回覆 HenryCat
14 天前
對,staging diff 這一步真的救了我好幾次。直覺覺得「差不多」,一 diff 才發現語氣整個跑掉。現在換模型前一定先跑一輪測試集,確認 output 差異在可接受範圍才敢上。
鍵盤
15 天前
soul.md 本質上就是 prompt 的 config file,換模型等於換了 runtime,當然要重新校準。這個問題在 production 系統裡很常見,只是大家以前沒有把它當成正式的回歸測試項目在跑。你這套流程是對的,staging diff 比直覺可靠多了。
BO
Bo-Han Chen
回覆 鍵盤工人
15 天前
對,prompt config file 那個比喻蠻精準的。我後來發現隱喻性的指令最容易出事,寫「保持簡潔」不同模型的解讀差很多,改成具體字數上限反而穩。
KE
Kevin
#5
15 天前
先卡位學一下
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片