ElevenLabs语音合成

4小时前更新 1 00

AI情感语音生成工具

收录时间：

2026-02-26

手机查看

ElevenLabs语音合成

技能简介

ElevenLabs TTS 是 OpenClaw 平台的语音合成技能，基于 ElevenLabs v3 API 将文本转换为富有情感的真人风格语音。支持 70 余种语言，可通过音频标签控制情绪变化，输出格式兼容 WhatsApp 等即时通讯场景。

能做什么

将文字转为自然流畅的 AI 配音，支持中英文及 70+ 语种
使用 [soft]、[excited]、[nervous] 等标签注入情感变化
生成适合 WhatsApp 发送的 Opus 格式语音消息
调节语速、稳定性、风格强度等参数定制声音特质

使用说明

安装与配置

安装 ffmpeg 并确保其在系统 PATH 中可用（用于音频格式转换）
访问 elevenlabs.io 注册账号，进入 Profile → API Keys 获取密钥

在 OpenClaw 配置文件 openclaw.json 中添加以下配置：

{"messages":{"tts":{"provider":"elevenlabs","elevenlabs":{"apiKey":"sk_your_api_key_here","voiceId":"pNInz6obpgDQGcFmaJgB","modelId":"eleven_v3","languageCode":"en","voiceSettings":{"stability":0.5,"similarityBoost":0.75,"style":0,"useSpeakerBoost":true,"speed":1}}}}}

基础用法示例

[soft] 今天是个特别的日子...[pause] [happy] 我们终于做到了！

常用音频标签：[whispers] 低语、[gasps] 倒吸气、[laughs] 笑声、[sighs] 叹息、[hesitates] 犹豫等。

输入与输出

见下方输入与输出表格。

项目	内容
输入	带音频标签的文本字符串；语言代码（如 en/zh/es）；音色 ID；稳定性/相似度/风格/语速参数
输出	MP3 或 Opus 格式音频文件，可直接播放或发送至 WhatsApp
适用人群	播客制作者、游戏开发者、客服机器人开发者、多语言内容运营者
不包含	视频生成、歌声合成、自定义音色训练、离线模式

风险提示

单次文本建议控制在 800 字符以内，超过 10,000 字符将被 API 拒绝
长文本会导致音色不一致，建议分段处理
稳定性参数高于 0.7 会降低音频标签的响应效果
需妥善保管 API Key，避免泄露导致额度被盗用
ffmpeg 未安装或不在 PATH 中时，WhatsApp 格式转换将失败

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/shaharsha/elevenlabs-tts/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

ElevenLabs语音合成

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

YouTube字幕提取

Pathé荷兰电影查询

语音转文字服务

Kokoro语音合成

阅读深度回溯

AI代理博客发布

YouTube语音摘要

ElevenLabs语音合成

暂无评论

标签云