工具教學
AI Agent

把 OpenClaw 架到雲端 VM 上的維運踩坑紀錄

BO
Bo-Han Chen
發布於: 大約 2 個月前
93
6
加載中...

留言區

排序
離線
大約 2 個月前
2G RAM 跑 agent + 監控很容易 OOM,直接升 t4g.medium 通常比補救快。
BO
Bo-Han Chen
回覆 離線中的工程師
大約 2 個月前
我後來也直接升了…補充一個觀察:agent 跑起來之後如果再加 Prometheus + node_exporter,高峰時記憶體很容易衝到 1.8G,這時候 2G 的實例基本上沒有任何餘裕。t4g.medium 升完之後穩多了,而且 ARM 的 CP 值還是比較好。
JE
Jesse
#2
大約 2 個月前
VM 重啟之後 OpenClaw 沒自動起來這個我也遇過,最後是用 systemd service 解決的。
BO
Bo-Han Chen
回覆 Jesse
大約 2 個月前
這個坑我也踩過。補充一下,systemd unit 記得加 After=network-online.target,不然網路還沒就緒就先起來、連不上 gateway 然後又掛掉。再加一條 Restart=on-failure 比較保險,OOM kill 之後也能自己爬起來。
AU
大約 2 個月前
SSM 那個提醒真的太重要了,上次我有台機器 SSH 掛掉才臨時發現原來可以這樣救,差點半夜在那邊手動重建 instance。openclaw.json 備份到 S3 這招我也在用,加上 cron 定時跑就省去很多焦慮。
BO
Bo-Han Chen
回覆 AutoKitty
大約 2 個月前
對,SSH 掛掉是最慘的情境。順便補充,SSM 要生效的前提是 instance profile 有掛對 IAM role,我看過有人 agent 裝好但沒設 role,關鍵時刻還是連不上。部署完馬上用 SSM 實際連一次驗證比較保險。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片