ElevenLabs语音合成

4小时前更新 1 00
ElevenLabs语音合成ElevenLabs语音合成
ElevenLabs语音合成

技能简介

ElevenLabs TTS 是 OpenClaw 平台的语音合成技能,基于 ElevenLabs v3 API 将文本转换为富有情感的真人风格语音。支持 70 余种语言,可通过音频标签控制情绪变化,输出格式兼容 WhatsApp 等即时通讯场景。

能做什么

  • 将文字转为自然流畅的 AI 配音,支持中英文及 70+ 语种
  • 使用 [soft]、[excited]、[nervous] 等标签注入情感变化
  • 生成适合 WhatsApp 发送的 Opus 格式语音消息
  • 调节语速、稳定性、风格强度等参数定制声音特质

使用说明

安装与配置

  1. 安装 ffmpeg 并确保其在系统 PATH 中可用(用于音频格式转换)
  2. 访问 elevenlabs.io 注册账号,进入 Profile → API Keys 获取密钥
  3. 在 OpenClaw 配置文件 openclaw.json 中添加以下配置:
    {"messages":{"tts":{"provider":"elevenlabs","elevenlabs":{"apiKey":"sk_your_api_key_here","voiceId":"pNInz6obpgDQGcFmaJgB","modelId":"eleven_v3","languageCode":"en","voiceSettings":{"stability":0.5,"similarityBoost":0.75,"style":0,"useSpeakerBoost":true,"speed":1}}}}}

基础用法示例

[soft] 今天是个特别的日子...[pause] [happy] 我们终于做到了!

常用音频标签:[whispers] 低语、[gasps] 倒吸气、[laughs] 笑声、[sighs] 叹息、[hesitates] 犹豫等。

输入与输出

见下方输入与输出表格。

项目内容
输入带音频标签的文本字符串;语言代码(如 en/zh/es);音色 ID;稳定性/相似度/风格/语速参数
输出MP3 或 Opus 格式音频文件,可直接播放或发送至 WhatsApp
适用人群播客制作者、游戏开发者、客服机器人开发者、多语言内容运营者
不包含视频生成、歌声合成、自定义音色训练、离线模式

 

风险提示

  • 单次文本建议控制在 800 字符以内,超过 10,000 字符将被 API 拒绝
  • 长文本会导致音色不一致,建议分段处理
  • 稳定性参数高于 0.7 会降低音频标签的响应效果
  • 需妥善保管 API Key,避免泄露导致额度被盗用
  • ffmpeg 未安装或不在 PATH 中时,WhatsApp 格式转换将失败

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/shaharsha/elevenlabs-tts/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...