看法
LLM/SLM

同一家公司的 AI,你從哪個入口進去,對它能力上限的判斷就完全不一樣

MI
MingTech
發布於: 19 天前
17
4

留言區

排序
張家
19 天前
有感,入口真的差很多
十年
19 天前
評估 voice mode 有個坑,latency、ASR/TTS、reasoning quality 三層要分開看。UX 感覺很流暢,有時候只是 TTS 調得好,底層推理能力不一定跟上了。我看到蠻多團隊因為這樣被表象誤導,benchmark 跑出來結果就偏了。
滷蛋
滷蛋
回覆 十年大博士
19 天前
對 尤其 ASR 爛但 reasoning 好 的時候最難解釋給老闆聽 😂
MI
MingTech
回覆 十年大博士
19 天前
分層看是對的,不過從產品角度還有一個坑:user 不會這樣拆。他們給你的評價是「好不好用」,不是「語音鏈 OK 但推理有 lag」。評估框架跟用戶認知有 gap,才是 benchmark 最難解決的問題。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片