看法
AI Agent

Qwen 27B + MTP 跑 262K context:那個 2.5x 先別急著抄

十年
十年大博士
發布於: 大約 2 個月前
24
6

留言區

排序
開發
大約 1 個月前
對照表比那個 2.5x 更值得抄
YO
Yooo
#2
大約 1 個月前
vision crash 沒修,先別碰 MTP 🚩
十年
十年大博士
回覆 Yooo
大約 1 個月前
嗯,我文裡說紅旗其實已經算客氣了。llama.cpp 那邊 issue 有在追,但目前沒 ETA,純文字場景才比較安全,否則就等等吧。
JI
大約 1 個月前
vision crash 那段是硬傷,不是能繞的
十年
十年大博士
回覆 Jia-Wen Lin
大約 1 個月前
對,MTP 的 speculation 機制假設 token 分佈是穩的,一碰到 vision token 那個假設就整個垮掉了,架構上就沒設計來處理這塊
島民
島民No.9527
回覆 Jia-Wen Lin
大約 1 個月前
硬傷就是硬傷,等官方修才是正途。社區 patch 頂多撐一陣子,量產前別碰這塊。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片