ElevenLabs语音合成

21分钟前更新 1 00

AI语音生成与声音管

收录时间：

2026-02-26

手机查看

ElevenLabs语音合成

技能简介

ElevenLabs Skill 提供通过 ElevenLabs API 进行语音合成、音效生成、音乐创作及声音管理的完整工具集，支持多种输出格式与自定义参数。

业务背景

ElevenLabs语音合成能力让业务人员无需专业录音设备，即可快速生成多语言、多情绪的真人级语音内容，适用于客服播报、营销素材、培训课件等场景。同时支持音效与背景音乐创作，大幅降低音频制作门槛与外包成本。

落地案例：市场部需为新品发布制作多版本宣传音频：中文沉稳版用于官网、英文活力版投放到海外社媒。通过该工具输入文案并选择对应音色与情绪参数，10分钟内即可输出MP3文件；若需配套科技感背景音，同步生成音效后混音完成，全程无需联系配音工作室。

能做什么

将文本转换为自然语音，支持多音色与情绪调节
生成各类音效片段与循环音频
创作完整音乐作品或背景配乐
查询可用语音库并获取语音ID
基于音频样本即时克隆自定义声音
查看账户配额使用情况及订阅状态

使用说明

环境准备

确保系统已安装 Python 3
在环境变量中设置 ELEVENLABS_API_KEY：
export ELEVENLABS_API_KEY="your_api_key_here"

基础用法示例

文本转语音：

python3 {baseDir}/scripts/speech.py "你好世界" -v <voice_id> -o output.mp3

生成音效：

python3 {baseDir}/scripts/sfx.py "电影爆炸声" -o boom.mp3

创作音乐：

python3 {baseDir}/scripts/music.py --prompt "轻快的电子乐前奏" --length-ms 6000 -o intro.mp3

克隆声音：

python3 {baseDir}/scripts/voiceclone.py --name "我的声音" --files sample1.mp3 sample2.mp3

查看配额：

python3 {baseDir}/scripts/quota.py --usage

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本字符串、音效/音乐描述词、音频样本文件、语音ID、格式参数（如 mp3_44100_128、pcm_24000）、时长设置（毫秒）
输出	音频文件（MP3/PCM）、JSON格式的语音列表、配额使用统计报告、新克隆语音的ID
适用人群	多媒体内容创作者、播客与有声书制作团队、游戏音效设计师、广告配音需求方、需要自动化语音生成的开发者
不包含	视频生成、图像处理、实时语音通话、本地离线模型运行、自动版权清理服务

风险提示

API 调用按字符数计费，需关注配额消耗
克隆他人声音可能涉及法律风险，需获得授权
生成内容需遵守 ElevenLabs 使用条款
高采样率格式会占用更多存储空间

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/odrobnik/elevenlabs-skill/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

ElevenLabs语音合成

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

MoltFeed社交发布

AI代理职业网络

安全媒体处理

Moltbook社交互动

WhatsApp语音对话

病毒安全检测

飞书日历管理

语音转文字

暂无评论

标签云