agent-browser skill
原作者:胡嘉璽
連 Browser Use 也有好壞之分 - agent-browser skill 真的無敵強大
在使用 Claude Code 時常常會需要瀏覽器開啟來執行一些動作。尤其現在 Agent 太強大,甚至連 Captcha 都能破解。最早期裝了一些 MCP,後來有了 chrome-devtools MCP 覺得無敵強,但大部分的網站會擋(被發現機器人),就轉向了 Claude Code 內建的 playright。
Playright 好是好,但 token 用量有點多,反應有點慢,而且常常碰到爆 Context Window 的問題。但也能勉強用用,沒想到今天 Vercel 的大頭釋出了一個自己開發的 agent-browse,用了之驚為天人。
大概提供了超過 200 種的瀏覽器操作,你想到的都有。開啟、點擊、聚焦、打字、填表、按鍵、勾選、截圖、滑鼠、設定、存檔、cookies、標籤頁.....,反正你想到的都有。最屌的是,它可以在headless下操作,因此常常我們遠端到Linux的主機上無法開啟瀏覽器的情況下,就還是可以完成和瀏覽器一模一樣的動作了。
安裝很簡單,要先安裝好 npm 就行了。執行下面動作:
npm install -g agent-browser
agent-browser install # Download Chromium就可以在 Linux/MacOS的命令行使用了。如果要裝到 Claude Code 中,執行下面:
mkdir -p .claude/skills/agent-browsercurl -o .claude/skills/agent-browser/SKILL.md \
https://raw.githubusercontent.com/vercel-labs/agent-browser/main/skills/agent-browser/SKILL.md?fbclid=IwY2xjawPS4ENleHRuA2FlbQIxMABicmlkETFaSWttWnphSll5aWhkQ1ZWc3J0YwZhcHBfaWQQMjIyMDM5MTc4ODIwMDg5MgABHu8Sy_XlaUXUv94kcXh2BfDC-jciWucTkTTKVLhfWz_LI8qkJiGQa5dsdxBK_aem_7fbO2mb9lOlKQOmhZSC5zwskill 原檔連結
然後你就可以在Claude Code中看到這個skill了。使用的時候直接顯示呼叫「使用agent-browser來幫我xxxxx」即可。效果一級棒。大家可以下載玩玩,我目前也把這個當做Claude Code的瀏覽器主力了。
作者:Chi