反爬虫浏览器自动化
C++级隐身浏览器绕
Desktop Control 是一款桌面自动化技能,通过 Python 实现鼠标、键盘、屏幕的编程控制。支持像素级鼠标定位、文本快速输入、屏幕区域截图、窗口状态管理等功能,适用于重复性界面操作的自动化场景。
安装依赖
pip install pyautogui pillow opencv-python pygetwindow
基础调用
from skills.desktop_control import DesktopController
# 初始化(启用安全保护)
dc = DesktopController(failsafe=True)
# 鼠标移动到坐标(500,300)
dc.move_mouse(500, 300)
# 在当前位置左键单击
dc.click()
# 在指定坐标右键双击
dc.click(100, 200, button="right", clicks=2)
# 输入文本
dc.type_text("Hello from OpenClaw!")
# 执行快捷键复制
dc.hotkey("ctrl", "c")
# 截取屏幕
dc.screenshot()
更多 API 包括:相对移动 move_relative()、拖拽 drag()、滚轮 scroll()、获取鼠标位置 get_mouse_position()、查找图像 locate_on_screen()、获取窗口列表 get_windows()、激活窗口 activate_window() 等。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 目标坐标(x,y);操作类型(移动/点击/输入/截图/窗口管理等);可选参数(持续时间、按键组合、图像模板路径、滚动方向等) |
| 输出 | 操作执行结果;鼠标当前坐标;截图图像数据(PIL Image);窗口信息列表(标题、位置、尺寸);图像匹配位置坐标 |
| 适用人群 | 测试工程师、RPA 开发者、技术支持人员、需要自动化 GUI 操作的用户 |
| 不包含 | 移动端控制;无图形界面的后台进程管理;底层硬件驱动级输入;Web 浏览器专属自动化(需配合其他工具) |
原始链接:https://github.com/openclaw/skills/tree/main/skills/matagul/desktop-control/SKILL.md
来源类型:GitHub 开源仓库