浏览器CLI控制浏览器CLI控制
浏览器CLI控制

技能简介

clawbrowser 通过 Microsoft Playwright CLI 实现浏览器控制,支持导航、表单交互、截图录屏、数据提取和会话管理,无需加载完整 MCP 浏览器环境。

业务背景

无需完整MCP环境,通过命令行即可远程操控浏览器完成自动化任务。业务人员可快速实现网页导航、表单填报、数据抓取等操作,同时留存截图、视频等审计证据,大幅降低重复性网页操作的人力成本。

落地案例:运营团队每日需从多个后台导出数据报表。使用浏览器CLI控制,配置一次登录会话保持Cookie,编写脚本自动打开各系统、点击导出按钮、截取确认页面,全程录屏存档。DOM变化时重新生成快照更新元素引用,确保流程稳定运行,单人即可管理数十个站点的日常取数任务。

能做什么

  • 命令行驱动浏览器打开页面、点击元素、填写表单
  • 生成页面快照获取元素引用,执行截图、PDF导出
  • 管理多会话隔离,保持登录状态和Cookie持久化
  • 录制操作轨迹和视频,便于后续回放排查
  • 捕获控制台日志和网络请求辅助调试

使用说明

安装指令:

npm install -g @playwright/cli@latest
playwright-cli --help

基础操作流程:

  1. 启动页面:playwright-cli open <url>,可加 --session=name 指定会话
  2. 生成快照:playwright-cli snapshot 获取元素引用 e1、e2 等
  3. 执行交互:使用 fillclickselect 等命令配合元素引用
  4. DOM变化后重新执行 snapshot 避免引用失效
  5. 输出证据:screenshotpdfconsolenetwork

会话管理常用命令:

  • session-list / session-stop <name> / session-delete <name>
  • 设置环境变量 PLAYWRIGHT_CLI_SESSION=mysession 可省略重复参数

配置调优:

编辑 playwright-cli.json 调整浏览器类型、视口尺寸、超时时间、输出目录等,修改后执行 session-restart 生效。

输入与输出

见下方输入与输出表格。

项目内容
输入目标URL、元素引用标识、填充文本或选择值、会话名称(可选)、配置文件路径(可选)
输出页面截图文件、PDF文档、元素快照列表、控制台日志、网络请求记录、操作轨迹文件、视频录制文件
适用人群需要自动化网页操作的开发测试人员、批量数据采集场景、无头浏览器集成工作流、CI/CD中的UI验证环节
不包含可视化浏览器IDE界面、鼠标实时拖拽的精确坐标录制、跨设备移动端真机调试、浏览器插件扩展管理

 

风险提示

  • 元素引用具有时效性,页面跳转或DOM更新后需重新 snapshot
  • 会话数据持久化存储于本地,敏感站点使用后建议执行 session-delete 清理
  • headed 模式依赖图形环境,无桌面环境的服务器需额外配置
  • 网络不稳定可能导致截图或录屏中断,关键操作建议启用 tracing 留存证据

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/tezatezaz/clawbrowser/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...