文档实时获取
调用Context7
Desktop Control 是一款桌面自动化技能,通过代码控制鼠标移动、点击、拖拽,模拟键盘输入与快捷键,截取屏幕画面并识别图像元素,同时支持窗口管理与剪贴板操作。
安装依赖
pip install pyautogui pillow opencv-python pygetwindow
基础用法
from skills.desktop_control import DesktopController
# 初始化控制器(启用安全保护)
dc = DesktopController(failsafe=True)
# 鼠标移动到指定坐标
dc.move_mouse(500, 300)
# 在当前位置点击左键
dc.click()
# 在指定坐标右键点击
dc.click(100, 200, button="right")
# 输入文本
dc.type_text("Hello from OpenClaw!")
# 执行复制快捷键
dc.hotkey("ctrl", "c")
# 按回车键
dc.press("enter")
# 截取屏幕
dc.screenshot()
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 屏幕坐标、操作指令(移动/点击/拖拽/滚动)、文本内容、快捷键组合、窗口标识、图像模板 |
| 输出 | 鼠标当前位置、截图图像、元素匹配坐标、窗口列表、剪贴板数据、执行结果状态 |
| 适用人群 | RPA开发人员、UI测试工程师、需自动化桌面操作的办公用户 |
| 不包含 | 驱动级系统控制、远程桌面协议、移动端控制、游戏反作弊绕过 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/wpegley/desktop-control-1-0-0/SKILL.md
来源类型:GitHub仓库