共創 · 永續 · 包容 · 分享 · 社群
#評估方法
分享各類評估方式與指標,從傳統 NLP metrics 到 MMLU、MT-Bench、ARENA-Bench,再到自建資料集與人類評估方法
...
卡片
關注此子主題
#評估方法
分享各類評估方式與指標,從傳統 NLP metrics 到 MMLU、MT-Bench、ARENA-Bench,再到自建資料集與人類評估方法
...
卡片
關注此子主題
篩選
投稿卡片
主題牆
LLM/SLM
#評估方法
切換子主題:
全部
模型訓練與微調
框架與工具
安全性與挑戰
評估方法
繁中模型
資料集
生成內容趨勢
多模態應用
提示工程
提示詞庫
算力與基建
新模型發布
評估方法 - LLM/SLM | AILogora