Discord语音助手Discord语音助手
Discord语音助手

技能简介

Discord Voice 是 Clawdbot语音交互插件,让 AI 代理能够加入 Discord 语音频道,与用户进行自然语音对话。支持语音活动检测、实时语音转文字、AI 处理回复、文字转语音播放完整闭环。

业务背景

客服与社区运营场景下,纯文字交互存在表达效率低、情感传递弱等局限。该插件使AI代理具备语音对话能力,用户可通过自然说话方式获取服务,运营方则能拓展直播答疑、语音活动主持等场景,提升社区活跃度与用户停留时长,同时减轻人工坐席的重复咨询压力。

落地案例:游戏社群举办晚间语音问答活动,管理员邀请AI助手进入频道。玩家语音提问后,系统实时转写内容并由AI生成回答,再以语音播报回馈全场。相比传统文字机器人需切换窗口查看回复,语音闭环让参与者保持沉浸体验,活动期间互动频次较往期文字模式提升显著。

能做什么

  • 通过斜杠命令或 CLI 加入/离开 Discord 语音频道
  • 自动检测用户说话状态(VAD)
  • 将语音实时转为文字,支持 Whisper API、Deepgram 或本地离线模型
  • 流转式语音识别降低约 1 秒延迟
  • 调用 Clawdbot 代理处理对话内容
  • 将 AI 回复转为语音播放,支持 OpenAI TTS、ElevenLabs 或 Kokoro 本地模型
  • 用户说话时自动打断当前播放(Barge-in)
  • 断线后自动重连

使用说明

1. 安装系统依赖

# Ubuntu/Debian
sudo apt-get install ffmpeg build-essential python3

# Fedora/RHEL
sudo dnf install ffmpeg gcc-c++ make python3

# macOS
brew install ffmpeg

2. 安装插件

clawdhub install discord-voice

或手动安装:

cd ~/.clawdbot/extensions
git clone <repository-url> discord-voice
cd discord-voice
npm install

3. 配置 clawdbot.json

{
  "plugins": {
    "entries": {
      "discord-voice": {
        "enabled": true,
        "config": {
          "sttProvider": "local-whisper",
          "ttsProvider": "openai",
          "ttsVoice": "nova",
          "vadSensitivity": "medium",
          "streamingSTT": true,
          "bargeIn": true,
          "allowedUsers": []
        }
      }
    }
  }
}

4. Discord 机器人权限设置

确保机器人拥有以下权限:Connect(连接语音频道)、Speak(发言)、Use Voice Activity(使用语音活动)。

输入与输出

见下方输入与输出表格。

项目内容
输入Discord 语音频道音频流;用户语音指令;STT/TTS 服务商 API 密钥;插件配置参数(识别引擎、语音模型、灵敏度等)
输出AI 语音回复(播放至 Discord 频道);实时语音转写文本;代理处理结果日志
适用人群Discord 社区运营者;需要语音交互的 AI 代理场景;游戏公会/在线协作团队;无障碍交互需求用户
不包含视频通话功能;多语言实时翻译;语音克隆定制;永久免费商用 API

 

风险提示

  • 需要有效的 Discord Bot Token 及语音相关权限
  • 使用云端 STT/TTS 服务需配置对应 API 密钥,产生调用费用
  • 本地 Whisper 和 Kokoro 需满足硬件资源要求
  • 语音数据传输涉及隐私合规考量
  • 长时间录音受 maxRecordingMs 参数限制(默认 30 秒)

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/avatarneil/discord-voice/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...