Playwright + VNC 混合自动化
适用人群
适合:要做品牌配音、播客旁白或助手语音的人、要批量生成课程讲解、短视频配音或音频播报的人、要把固定音色接进客服、内容生产或语音产品流程的人。
技能介绍
这个技能主要用于语音克隆、语音生成和音频内容处理,适合把文本快速变成可直接使用的语音结果。
— name: playwright-desktop-hybrid description: 通过 Playwright 控制浏览器内的 VNC 客户端,从而实现同时操控 Web 页面、内嵌桌面应用程序和其他 GUI 程序的 Python 库,组成一个 Skill。 trigger:。
业务背景和落地案例
当团队需要语音处理时,可以先用Playwright + VNC 混合自动化完成第一轮处理。常见做法是把相关文件、网址、素材或配置交给它,先产出初版结果,再由人工确认和继续推进。
能做什么
- playwright vnc。
- vnc in browser。
- playwright + vnc。
- 🌐 纯浏览器方案 – 所有操作通过浏览器完成,无需本地 pywinauto。
- 🎭 统一 API – 使用 Playwright 同时控制 Web 和桌面。
- 👁️ 可视化 – 实时看到 VNC 桌面操作过程。
- 🔒 隔离安全 – 桌面控制运行在浏览器沙箱内。
- 📸 自动截图 – 利用 Playwright 的截图功能记录 VNC。
安装方法
方式 1:对 OpenClaw 说(不用写代码)
适合:OpenClaw、Codex、Kimiclaw、Windsurf、Trae、华为 CodeArts。
直接对 OpenClaw 说:
帮我安装一个叫 Playwright + VNC 混合自动化 的 Skill。
如果安装时需要精确名字,就用 python-skill-vnc。
装好以后,先用它帮我处理一遍当前任务。
如果需要手动安装,可以用这条命令:
clawhub install python-skill-vnc
方式 2:导入 MD 安装
适合:腾讯Workbuddy、百度Duclaw、字节Arkclaw、智谱Autoclaw、科大讯飞Astronclaw。
- 找到这条 Skill 自带的 Markdown 文件,通常就是它的
SKILL.md 或同名 .md 文件。 - 把这个 Markdown 文件导入到你的产品里。
- 导入完成后,直接对 AI 说:
用刚刚导入的Playwright + VNC 混合自动化,先帮我处理当前任务。
备注:这一种本质上是导入一个 Markdown 文件,给知道安装包里有 .md 文件的人即可。
方式 3:代码安装
适合:Claude Code、Cursor、通义灵码、文心快码。
最短可用命令:
python demo.py all
如果要继续执行,可以再用:
python demo.py drag # 拖拽演示
curl http://localhost:6080
使用步骤
- 先选上面 3 种方式里,自己最容易完成的一种。
- 安装完成后,直接对 OpenClaw 说:“用Playwright + VNC 混合自动化帮我处理当前任务。” 先让它自己跑一遍就可以。
- 如果你已经有明确文件、网址、目录或数据,再把它补给 OpenClaw,让它只处理这一部分。
- 先看第一轮结果,再决定要不要追加条件、缩小范围或继续执行下一步。
- 如果这条 Skill 确实好用,就把它保留在常用列表,后面重复任务直接复用。
你需要准备什么
- 与你当前任务相关的文件、网址、目录或数据。
- 要处理的文本内容。
- 语音样本、参考音色或角色要求。
- 输出格式、语言或时长要求。
- 如果这条 Skill 依赖外部服务,还要准备对应账号权限或可用凭证。
你会看到什么结果
- 可直接使用的音频结果。
- 语音角色配置或语音 ID。
- 后续可继续复用的语音处理结果。
风险提示
- 涉及 API Key、Token 或其他凭证时,先确认保存方式和权限边界。
- 依赖外部服务时,网络波动、配额限制或接口变化都会影响结果。
- 自动化页面流程容易受页面结构变化影响,正式使用前先跑一遍最小示例。
来源信息
- 公开页面地址: https://agentskillsrepo.com/skill/wangzjpku/python-skill-vnc
- SKILL.md 下载地址: https://agentskillsrepo.com/skill/wangzjpku/python-skill-vnc/download