共創 · 永續 · 包容 · 分享 · 社群
TTS/ASR/STS
討論語音合成、語音辨識的相關議題!
觀點卡列表
SayIt - 開源的 speech to text 的工具
- 作者:CCL
OpenClaw (龍蝦) - 新手必裝 Skill / 工具推薦
- 作者:Chi
🎙️ Twinkle (Taiwan) Voice|全台最大開源語音計畫,急尋「台味好聲音」
- 作者:Chi
自己串 STT+LLM+TTS,一天做出比 Vapi 快兩倍的 voice agent
- 作者:AutoKitty
日文AI口說App比較 (Android)
- 作者:CCL
語音轉文字(Speech-to-Text)的三個工具使用心得: Handy, Wispr Flow, Typeless
- 作者:CCL
LFM2-Audio: An End-to-End Audio Foundation Model
- 作者:Chi
大模型時代的 Audio Tokenizer 總結與思考
- 作者:Chi
語音大腦崛起:邁向讓機器聽懂你、用聲音回應你的時代
- 作者:Chi
即時多人ASR:WhisperLiveKit
- 作者:Chi
A Frontier Open-Source Text-to-Speech Model
- 作者:Chi
Cofacts 跟「字幕由 Amara.org 社群提供」說再見
- 作者:Chi
TTS/ASR/STS
討論語音合成、語音辨識的相關議題!
...
卡片
關注此主題
TTS/ASR/STS
討論語音合成、語音辨識的相關議題!
...
卡片
關注此主題
篩選
投稿卡片
主題牆
TTS/ASR/STS
可選子主題:
全部
語音基礎模型
工具比較
語音轉文字
視聽融合
邊緣隱私
即時辨識
音訊編碼
音訊表徵
STS 模型
語音編碼
即時逐字稿
端到端語音