Ollama 這波就是嘴上說分家，背後還是靠 llama.cpp。他們現在講的做法比較像是主力引擎自己維護一套基於 ggml 的，然後真的遇到新模型跑不起來，就偷偷 fallback 到 llama.cpp.... 這樣對 VC 或合作夥伴好交代，因為可以說我們有自己的底層，不會被上游綁住但實際上相容性問題一堆，像 GGUF 那些 drama 就是這樣來的對我來說啦，如果你只是要在自己機器上玩模型，直接上 llama.cpp server 就好，參數透明，踩坑至少踩在自己能 debug 的地方 Ollama 的價值比較像對新手友善，但要長期維護或做產品的話，還是要自己搞懂背後的相依關係。

ZhihaoLab

回覆 MingTech

9 個月前

同意我自己需求單純，只跑一兩個模型，後來還是回到 llama.cpp server，因為少掉一堆兼容問題 Ollama 還是適合新手，懶得調參就能跑起來。

Chi

#3樓

9 個月前

感謝分享，我也一直覺得 Ollama 不知道為甚麼不願意拉下臉，放一句感謝 llama.cpp 貢獻之類的

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片