實測經驗
TTS/ASR/STS

SayIt - 開源的 speech to text 的工具

CC
CCL
發布於: 大約 1 個月前
98
14
加載中...

留言區

排序
JE
Jesse
#1
大約 1 個月前
長段識別失敗我踩過,解法是先在本地做 silence detection 切成短片段,再一段一段丟 Groq。基本上不會再炸了。
RU
Ruby Chou
回覆 Jesse
大約 1 個月前
這個解法很聰明,不過從 end user 角度想,這些前處理理想上應該工具自己內建吧 😅 要讓一般人去做 silence detection 門檻有點高。
荷包
大約 1 個月前
Groq 免費版有用量上限,日常用會不會撞到?如果真的長期免費那這個 setup 也太划算了
CT
CtrlC
回覆 荷包君
大約 1 個月前
Groq 免費版有 daily token limit,輕度用通常撞不到,但如果哪天用量爆了還是要備個 fallback API key(OpenAI / local Whisper)才放心。
CC
CCL
回覆 荷包君
大約 1 個月前
目前我測試快一個禮拜,日常用很難撞到他的上限 他上限其實蠻高的,除非你就跟我在文章裡面講一樣,除非你特別把你決定用電腦的時候就都不用打字了,都直接用講的,要不然基本上還蠻難撞到的 那所謂的長期免費,當然這一個程式目前是開源免費的 就要看 Groq 最後未來會不會繼續是免費的狀況了
荷包
荷包君
回覆 CCL
大約 1 個月前
好啦這樣我比較安心,一般用量不會撞到的話就先用著。未來收費這件事倒是要留意,說不定哪天突然宣布付費方案,到時候再說吧,至少現在省一筆
CH
ChiaYoa
#3
大約 1 個月前
#VoxPen #語墨 你有用過嗎? 也是類似的東西
純濃
純濃燕麥當勞
回覆 ChiaYoa
大約 1 個月前
語墨用過 介面比較精緻但不開源 這個可以自己 host 才是重點吧 不然資料都在別人那
CC
CCL
回覆 ChiaYoa
(已編輯)大約 1 個月前
剛剛測試過了,感覺效果比 SayIt 好一點點,但他最大的致命傷就是他要付錢 我還再測試他能不能代替 Typeless...
CH
Chi
#4
大約 1 個月前
這個很棒欸,我 Typeless,Wispr Flow 都有用 Wispr Flow 還有訂閱,但是錯誤率真的太高用不習慣。 不過沒想到 Jackle 的作品會在這邊看到,支持!
純濃
大約 1 個月前
Wispr Flow 那個錯誤率我也覺得很玄 說一半就自己去別的地方了 然後訂閱費還不便宜 笑死
JA
Jackle Chen
回覆 Chi
大約 1 個月前
感謝推薦,我也沒想到會在這看到被推薦 XDDDDD
CC
CCL
回覆 Jackle Chen
大約 1 個月前
這個工具真的蠻好用的 期待之後的更新版本會有更好更多的功能 除了這個論壇以外,我也會在自己的部落格上面宣傳 看看會不會有更多人來使用這個應用程式
純濃
大約 1 個月前
我最近也在找替代的,謝分享
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片