浏览器自动化CLI

3小时前更新 1 00
浏览器自动化CLI浏览器自动化CLI
浏览器自动化CLI

技能简介

基于Stagehand的浏览器自动化命令行工具,通过自然语言指令完成网页导航、元素交互、数据提取和截图等操作。支持本地Chrome和远程Browserbase两种运行模式。

能做什么

  • 自动访问指定网址并浏览网页
  • 用自然语言描述点击按钮、填写表单等操作
  • 按指定格式提取页面数据
  • 捕获网页截图保存为图片
  • 发现页面可用元素列表

使用说明

首次安装(setupComplete为false时):

npm install
npm link

基础命令:

browser navigate <url>                    # 访问网址
browser act "<动作描述>"                  # 执行自然语言动作
browser extract "<提取指令>" ['{}']       # 提取数据(可选JSON格式)
browser observe "<查询条件>"              # 发现页面元素
browser screenshot                        # 截图
browser close                             # 关闭浏览器

环境选择逻辑:自动检测.env文件中的BROWSERBASE_API_KEY和BROWSERBASE_PROJECT_ID,存在则使用远程Browserbase,否则 fallback 到本地Chrome。

输入与输出

见下方输入与输出表格。

项目内容
输入目标网址、自然语言指令(如”点击登录按钮”)、数据提取规则、可选JSON格式模板
输出命令执行反馈、结构化提取数据、PNG截图文件、页面元素清单
适用人群开发者、数据采集团队、测试人员、需简化浏览器操作的业务人员
不包含图形界面、操作录制功能、多实例并发、内置IP代理轮换

 

风险提示

  • 本地模式需要预先安装Chrome浏览器
  • 远程模式需妥善保管API密钥,避免泄露
  • 自动化操作前建议先截图确认页面状态
  • 部分网站可能检测自动化工具并限制访问

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/peytoncasper/stagehand-browser-cli/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...