云端浏览器自动化

2小时前更新 4 00
云端浏览器自动化云端浏览器自动化
云端浏览器自动化

技能简介

browser-use 提供基于云端的浏览器自动化能力,支持在远程环境中打开网页、填写表单、截取屏幕、提取数据等操作。浏览器会话在命令之间保持,可完成多步骤复杂流程。

能做什么

  • 自动导航至指定网址并维持会话状态
  • 识别页面元素并通过索引进行点击、输入、选择等交互
  • 截取网页截图保存为文件或输出base64编码
  • 执行JavaScript代码获取页面信息
  • 运行云端AI代理完成复杂任务

使用说明

安装与验证

# 安装后运行诊断检查
browser-use doctor

基础操作流程

  1. 打开网页:browser-use open <url>
  2. 查看可交互元素:browser-use state(返回带索引的元素列表)
  3. 执行操作:使用索引进行点击 browser-use click 5 或输入 browser-use input 3 "文本"
  4. 验证结果:再次运行 browser-use statebrowser-use screenshot

浏览器模式选择

  • Chromium(默认):快速隔离的无头模式
  • Real Chrome:使用真实Chrome二进制文件,支持登录态复用
  • Remote:云端托管浏览器,支持代理配置

常用命令示例

# 云端浏览器打开页面
browser-use --browser remote open https://example.com

# 获取页面状态与元素索引
browser-use state

# 点击索引为5的元素
browser-use click 5

# 截图保存
browser-use screenshot result.png

# 执行JS获取标题
browser-use eval "document.title"

# 启动云端AI代理执行任务
browser-use -b remote run "搜索产品价格"

输入与输出

见下方输入与输出表格。

项目内容
输入目标网址、操作指令(open/click/input/screenshot/state等)、元素索引、浏览器模式(chromium/real/remote)、待输入文本、JavaScript代码、等待条件
输出页面状态(URL/标题/元素列表)、截图文件或base64、元素文本/HTML、JS执行结果、云端任务状态
适用人群网页测试人员、数据抓取开发者、需要云端浏览器环境的自动化流程
不包含本地可视化浏览器窗口(默认无头模式)、验证码自动破解、浏览器插件执行、PDF生成功能

 

风险提示

  • 使用real模式并加载个人Chrome配置时,Cookie和登录信息会被复制到CLI环境
  • 云端浏览器任务为异步执行,需通过task status查询进度
  • 长时间未关闭的会话可能占用云端资源,建议完成后执行close清理
  • 部分网站对自动化访问有检测机制,可能触发验证或封禁

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/shawnpana/browser-use/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...