浏览器CLI控制
Playwright
基于Rust开发的浏览器自动化引擎,通过Chrome DevTools Protocol直接操控Chrome,实现轻量级二进制部署。针对Token效率优化DOM提取,支持稳健的会话管理与高速运行。
极速浏览器自动化适用于数据采集、竞品监控、合规审计等业务场景。它能模拟真人操作绕过反爬机制,自动提取动态加载内容,同时支持会话复用减少重复登录成本。相比传统方案,Rust引擎带来更快的执行速度与更轻量的部署体验,帮助业务团队高效获取网页数据。
落地案例:某电商运营团队需每日追踪竞品价格与库存变化。通过配置目标商品页URL与CSS选择器,系统自动模拟真人浏览行为(随机鼠标轨迹与延迟),绕过平台反爬检测;对无限滚动页面设置自动翻页参数,完整抓取动态加载的商品列表;首次手动登录后保存会话Cookie,后续任务直接复用免登状态。最终输出结构化JSON数据供分析系统接入。
安装方式(二选一):
# Homebrew安装
brew install rknoche6/tap/fast-browser-use
# Cargo安装
cargo install fast-browser-use
环境配置:
# 设置Chrome路径(必需)
export CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# 可选:启用无头模式
export BROWSER_HEADLESS="true"
基础用法示例:
# 导航并等待元素
fast-browser-use navigate --url "https://example.com" --wait-for-selector "#content"
# 无限滚动收割数据
fast-browser-use harvest --url "https://news.ycombinator.com" --selector ".titleline a" --scrolls 3 --delay 800 --output headlines.json
# 手动登录保存会话
fast-browser-use login --url "https://github.com/login" --save-session ./auth.json
# 复用会话访问
fast-browser-use navigate --url "https://github.com/dashboard" --load-session ./auth.json
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 目标URL、CSS选择器、会话文件路径、滚动次数与延迟参数、CHROME_PATH环境变量 |
| 输出 | JSON格式提取数据、PNG截图文件、站点结构分析报告、会话状态文件 |
| 适用人群 | 需要高性能网页抓取的开发者、处理动态JavaScript内容的自动化工程师、需维持登录状态的数据采集人员 |
| 不包含 | 非Chrome浏览器支持、图形界面操作、分布式爬取调度、内置代理池管理 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/rknoche6/fast-browser-use/SKILL.md
来源类型:GitHub仓库