看法
LLM/SLM

評估 local model 可用性,我幾乎不看 token/s

VI
Vivian L
發布於: 大約 2 個月前
28
6

留言區

排序
JA
Jacky
#1
大約 1 個月前
TTFT 才是體感
ZH
大約 1 個月前
場景不分類,benchmark 等於白測
HE
大約 1 個月前
TTFT 0.3s 那段太真實了吧⋯
VI
Vivian L
回覆 HenryCat
大約 1 個月前
對哈,而且偏偏 vendor demo 幾乎都是 single user,concurrent load 底下的 TTFT 要自己另外問才知道
MI
大約 1 個月前
TTFT 這段很有感。我們之前 pilot 的時候工程師反映一個 throughput 不錯的 model 用起來「有點卡」,查了才知道是 TTFT 的問題。concurrent load 那個也是,single user benchmark 看起來沒問題,一到實際場景就垮。所以現在我都要求跑 concurrent load test 才算數。
VI
Vivian L
回覆 MingTech
大約 1 個月前
跑了才知道,single-user benchmark 真的很騙。concurrent test 現在是我的 hard requirement 了。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片