把 OpenClaw 架到雲端 VM 上的維運踩坑紀錄

發布於: 大約 2 個月前

加載中...

留言區

排序

#1樓

大約 2 個月前

2G RAM 跑 agent + 監控很容易 OOM，直接升 t4g.medium 通常比補救快。

回覆離線中的工程師

大約 2 個月前

我後來也直接升了…補充一個觀察：agent 跑起來之後如果再加 Prometheus + node_exporter，高峰時記憶體很容易衝到 1.8G，這時候 2G 的實例基本上沒有任何餘裕。t4g.medium 升完之後穩多了，而且 ARM 的 CP 值還是比較好。

#2樓

大約 2 個月前

VM 重啟之後 OpenClaw 沒自動起來這個我也遇過，最後是用 systemd service 解決的。

回覆 Jesse

大約 2 個月前

這個坑我也踩過。補充一下，systemd unit 記得加 After=network-online.target，不然網路還沒就緒就先起來、連不上 gateway 然後又掛掉。再加一條 Restart=on-failure 比較保險，OOM kill 之後也能自己爬起來。

#3樓

大約 2 個月前

SSM 那個提醒真的太重要了，上次我有台機器 SSH 掛掉才臨時發現原來可以這樣救，差點半夜在那邊手動重建 instance。openclaw.json 備份到 S3 這招我也在用，加上 cron 定時跑就省去很多焦慮。

回覆 AutoKitty

大約 2 個月前

對，SSH 掛掉是最慘的情境。順便補充，SSM 要生效的前提是 instance profile 有掛對 IAM role，我看過有人 agent 裝好但沒設 role，關鍵時刻還是連不上。部署完馬上用 SSM 實際連一次驗證比較保險。

關聯 / 被收藏牆

被引用

尚未被引用或收藏

相關卡片

尚無相關卡片