ElevenLabs语音合成

28分钟前更新 1 00

多语言AI语音生成工

收录时间：

2026-02-26

手机查看

ElevenLabs语音合成

技能简介

基于ElevenLabs API的高质量语音合成工具包，提供18种预设人声角色、32种语言支持、实时流式输出、音效生成及自定义声音设计功能。

业务背景

该工具包提供18种预设人声与32种语言覆盖，满足企业多角色、跨区域的语音内容需求。实时流式输出适合交互场景，音效生成功能可丰富多媒体素材，批量处理能力提升内容运营效率，配合成本监控实现预算可控。

落地案例：一家在线教育平台需要为课程视频配备不同风格的讲解声音。课程制作团队使用工具包指定'温暖亲和'预设人声生成导学语音，切换'专业沉稳'风格录制知识要点，同时为动画片段输入文本描述生成配套音效，最终批量导出MP3文件嵌入课件系统。

能做什么

将文本转换为自然语音，支持18种不同风格的人声角色
覆盖32种语言的跨语言语音合成
生成AI音效（SFX）响应文本描述
批量处理多个文本文件
创建自定义声音并管理发音词典
追踪字符使用量与预估费用

使用说明

安装准备：

确保系统已安装 Python 3
获取 ElevenLabs API Key（访问 elevenlabs.io 注册）
设置环境变量：export ELEVEN_API_KEY="your-api-key"（或 ELEVENLABS_API_KEY）

首次配置：

python3 scripts/setup.py

按向导完成：API Key录入 → 默认声音选择 → 语言偏好 → 音质设置 → 成本监控启用 → 预算上限（可选）。配置存储于本地 config.json，已自动排除在版本控制外。

基础用法：

# 列出所有可用声音
python3 scripts/tts.py --list

# 生成语音
python3 scripts/tts.py --text "Hello world" --voice rachel --output hello.mp3

# 使用预设角色
python3 scripts/tts.py --text "Breaking news..." --voice broadcaster --output news.mp3

# 德语合成示例
python3 scripts/tts.py --text "Guten Tag!" --voice rachel --lang de

# 查看使用统计
python3 scripts/tts.py --stats

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本字符串；声音角色标识（18种预设或自定义）；语言代码（32种可选）；输出文件路径；API密钥（环境变量配置）
输出	MP3音频文件；使用统计与成本估算；支持语言清单
适用人群	视频创作者、播客制作人、本地化工程师、教育培训开发者、游戏音频设计师
不包含	视频生成、实时语音变换、离线合成能力、免费无限调用

风险提示

API调用按字符数计费，建议启用成本追踪与预算上限
生成的语音内容需遵守ElevenLabs服务条款与适用地区法规
自定义声音设计功能可能产生额外费用
流式模式依赖网络稳定性，中断可能导致输出不完整

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/robbyczgw-cla/elevenlabs-voices/SKILL.md
来源类型：GitHub仓库

数据统计

暂无评论

暂无评论...

ElevenLabs语音合成

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

本地语音服务

文档转Markdown

MiniMax语音合成

语音转文字服务

Swarm并行计算

语音转MIDI工具

对齐语音助手

音频智能处理

暂无评论

标签云