远程语音播报工具

1小时前更新 1 00
远程语音播报工具远程语音播报工具
远程语音播报工具

技能简介

AgentVibes OpenClaw 是一套面向无图形界面服务器的语音输出方案,将文字转为语音后传输至 Linux、macOS 或 Android 设备播放。内置 50 余种音色,覆盖 30 多种语言,提供两种架构:服务端合成音频流推送(PulseAudio),或仅传文字由接收端本地合成(推荐后者以降低带宽)。

业务背景

远程语音播报工具让无图形界面的服务器和远程设备具备实时语音反馈能力。运维人员通过SSH管理服务器时可直接收听系统告警和操作提示,无需紧盯屏幕;多设备统一管理音色与播放状态,确保跨Linux、macOS、Android环境的一致体验;本地合成模式显著降低带宽占用,适合网络条件受限的远程场景。

落地案例:某数据中心运维团队夜间值班时,通过该工具为自动化巡检脚本配置语音播报:当服务器检测到磁盘空间不足,立即以预设音色向值班工程师的Android手机推送告警语音。团队统一使用en_US-amy-medium音色,并在高延迟的海外节点切换至文字流传输模式,由接收端本地合成播放,既保证告警时效又节省跨国带宽。

能做什么

  • 为 SSH 远程会话、AI 代理操作添加实时语音反馈
  • 在多设备间统一管理 TTS 音色与播放状态
  • 切换 Piper TTS(跨平台离线)或 macOS Say(原生内置)双引擎
  • 自定义前缀词、回放近期语音、静音/取消静音控制

使用说明

安装步骤(原始文档未提供,需手动部署):

  1. 克隆仓库:git clone https://github.com/openclaw/skills.git
  2. 进入技能目录:cd skills/paulpreibisch/agentvibes-openclaw-skill
  3. 根据目标平台安装依赖:Linux 需配置 PulseAudio 或 PipeWire;macOS 无需额外安装;Android 需配合 Termux 或专用接收端应用
  4. 启动服务并绑定目标播放设备

常用命令

  • /agent-vibes:mute / /agent-vibes:unmute — 全局静音开关
  • /agent-vibes:list [first|last] [N] — 浏览可用音色
  • /agent-vibes:switch <voice_name> — 切换默认声音
  • /agent-vibes:provider switch piper|macos — 更换合成引擎
  • /agent-vibes:add "名称" <voice_id> — 导入 Piper 自定义音色(ID 来自 piper.io)

输入与输出

见下方输入与输出表格。

项目内容
输入斜杠命令文本、Piper voice ID、前缀配置字符串
输出音频流或文字流、命令状态回显、音色列表
适用人群远程服务器运维人员、AI 代理开发者、多语言自动化用户
不包含Windows 原生支持、云端 API、GUI 配置、实时音效处理

 

风险提示

  • 音频流模式对网络延迟敏感,高延迟场景建议改用文字流传输
  • Piper TTS 模型文件需本地下载,首次使用特定语言时存在初始化等待
  • macOS Say 仅限苹果设备,跨平台混用需注意指令兼容性
  • 历史音频缓存最近 10 条,敏感内容需及时清理

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/paulpreibisch/agentvibes-openclaw-skill/SKILL.md
来源类型:GitHub 开源仓库

数据统计

相关导航

暂无评论

none
暂无评论...