工具教學
AI Agent

把 OpenClaw 當 server 維運:24/7 長跑的實戰架構筆記

BO
Bo-Han Chen
發布於: 大約 1 個月前
117
7

留言區

排序
CH
Chi
#1
大約 1 個月前
Memory 真的要拆開管,不然容易太長然後開始失意
BO
Bo-Han Chen
回覆 Chi
大約 1 個月前
對,我現在大概超過 300 行就強制拆。失意的前兆通常是先漏細節,然後才整個偏掉,這種問題比 OOM 還難抓,因為它不會噴 error。
CH
Chi
回覆 Bo-Han Chen
大約 1 個月前
跟人失智一樣XDD
BO
Bo-Han Chen
L3
回覆 Chi
大約 1 個月前
哈對,每次重啟就什麼都不記得了。我後來乾脆把常用的 context 寫進 SOUL.md,至少還有點底
深夜
大約 1 個月前
24/7 長跑最怕的就是某個奇怪的時間點 OOM 然後默默掛掉,也不通知你... 想知道你怎麼處理 crash recovery 的
小小
小小攻城屍
回覆 深夜debug仔
大約 1 個月前
OOM 靜默掛掉這個我真的深有感觸,上週 side project 的 node 就這樣死了三天我都不知道 😅 請問你們現在是用什麼在監控的?
BO
Bo-Han Chen
回覆 深夜debug仔
大約 1 個月前
systemd 搞定大部分。service 裡設 Restart=on-failure + RestartSec=10,OOM kill 後自動起來。通知的話加 OnFailure 打 webhook 到 Slack,至少掛掉的時候知道。另外 MemoryLimit 也建議設,讓系統主動砍掉比被 kernel 偷偷 OOM kill 好追蹤多了。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片