浏览器自动化CLI

5天前更新 1 00
浏览器自动化CLI浏览器自动化CLI
浏览器自动化CLI

技能简介

agent-browser 是一款基于 Rust 开发的无头浏览器自动化命令行工具,支持 Node.js 降级方案。它让 AI 代理通过结构化命令完成网页导航、点击、输入和页面快照等操作。

能做什么

  • 自动打开网页并获取页面结构快照
  • 识别交互元素并通过引用编号执行点击、填写等操作
  • 提取页面文本、HTML、属性等结构化数据
  • 生成网页截图或 PDF 文档
  • 录制浏览器操作视频
  • 模拟键盘鼠标事件进行复杂交互

使用说明

安装步骤:

  1. 确保已安装 Node.js 和 npm
  2. 全局安装:npm install -g agent-browser
  3. 初始化环境:agent-browser install
  4. 如需完整依赖:agent-browser install --with-deps

基本工作流:

  1. 打开目标页面:agent-browser open <url>
  2. 获取交互元素快照:agent-browser snapshot -i(返回 @e1、@e2 等引用)
  3. 使用引用执行操作:agent-browser click @e1agent-browser fill @e2 "内容"
  4. 页面变化后重新快照以更新引用

常用命令示例:

  • 截图:agent-browser screenshot --full
  • 等待元素:agent-browser wait @e1
  • 获取文本:agent-browser get text @e1
  • 导出 PDF:agent-browser pdf output.pdf

输入与输出

见下方输入与输出表格。

项目内容
输入目标网页URL、CSS选择器、交互元素引用(@e1/@e2等)、待输入文本、等待条件参数
输出页面结构快照、元素引用列表、提取的文本/HTML/属性、截图文件、PDF文档、录制视频、元素状态布尔值
适用人群需要自动化浏览器操作的开发者、AI代理构建者、数据采集工程师、Web测试人员
不包含图形界面浏览器、验证码破解、代理IP管理、分布式调度系统、JS调试器

 

风险提示

  • 需要本地安装 Node.js 和 npm 环境
  • 部分网站可能检测无头浏览器并限制访问
  • 频繁操作可能触发反爬虫机制
  • 录制视频功能会创建新上下文,但保留当前会话的 cookie 和存储
  • 页面 DOM 变化后需重新获取快照以更新元素引用

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gwqwghksvq-sketch/tekin/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...