共創 · 永續 · 包容 · 分享 · 社群
LLM/SLM
LLM/SLM 不同面向的討論都在這邊,子主題招募中
觀點卡列表
不同語言在不同模型的Tokenizer上的 token 數計算
- 作者:CCL
從 Tags 到 LLM Wiki:知識管理工具的演進與下一個挑戰
- 作者:Chi
MTP 合進 llama.cpp 後,27B 快了,但我的 35B 沒什麼感覺
- 作者:咖啡驅動開發
本地部署 1T 模型的取捨,整理了一個判斷框架
- 作者:承翰
24GB M4 跑本地模型的實測策略
- 作者:鍵盤工人
評估 local model 可用性,我幾乎不看 token/s
- 作者:Vivian L
IKP: 用冷知識找出模型參數量
- 作者:CCL
AI 也會用潛移默化的方式去教學嗎? 探討模型蒸餾、潛意識學習與 AI 安全性之間的關係
- 作者:CCL
LLM 沒有「懶惰」,所以它寫的 code 很危險
- 作者:鍵盤工人
文言文是LLM越獄的關鍵? 利用文言文繞過AI安全審查
- 作者:CCL
同一家公司的 AI,你從哪個入口進去,對它能力上限的判斷就完全不一樣
- 作者:MingTech
文言文能不能減少 token 數?
- 作者:CCL
[Ch2 導讀] 語言模型的基石:Token 決定了它看見什麼,Embedding 決定了它理解什麼
- 作者:Thomas
Caveman: 簡化 token 真的好嗎?
- 作者:CCL
Gemma 4 E4B 語音理解能力分析
- 作者:Liang-Hsun Huang
Claude Code 中的 15 個少用功能
- 作者:CCL
【Twinkle AI 熬夜書坊】全新開源讀書會連載中!
- 作者:Thomas
[Podcast 推薦] 解構 AI 推理的未來藍圖:vLLM 創作者視角
- 作者:Thomas
Anthropic: Claude code 原始碼外洩
- 作者:小緯
Anthropic 內部文件外流:新一代模型『Claude Mythos』
- 作者:小緯
LLM/SLM
LLM/SLM 不同面向的討論都在這邊,子主題招募中
...
卡片
關注此主題
LLM/SLM
LLM/SLM 不同面向的討論都在這邊,子主題招募中
...
卡片
關注此主題
篩選
投稿卡片
主題牆
LLM/SLM
可選子主題:
全部
模型訓練與微調
框架與工具
安全性與挑戰
評估方法
繁中模型
資料集
生成內容趨勢
多模態應用
提示工程
提示詞庫
算力與基建
新模型發布
知識管理
檢索與 RAG