ElevenLabs语音合成ElevenLabs语音合成
ElevenLabs语音合成

技能简介

ElevenLabs Skill 提供通过 ElevenLabs API 进行语音合成音效生成音乐创作及声音管理的完整工具集,支持多种输出格式与自定义参数。

业务背景

ElevenLabs语音合成能力让业务人员无需专业录音设备,即可快速生成多语言、多情绪的真人级语音内容,适用于客服播报、营销素材、培训课件等场景。同时支持音效与背景音乐创作,大幅降低音频制作门槛与外包成本。

落地案例:市场部需为新品发布制作多版本宣传音频:中文沉稳版用于官网、英文活力版投放到海外社媒。通过该工具输入文案并选择对应音色与情绪参数,10分钟内即可输出MP3文件;若需配套科技感背景音,同步生成音效后混音完成,全程无需联系配音工作室。

能做什么

  • 将文本转换为自然语音,支持多音色与情绪调节
  • 生成各类音效片段与循环音频
  • 创作完整音乐作品或背景配乐
  • 查询可用语音库并获取语音ID
  • 基于音频样本即时克隆自定义声音
  • 查看账户配额使用情况及订阅状态

使用说明

环境准备

  1. 确保系统已安装 Python 3
  2. 在环境变量中设置 ELEVENLABS_API_KEY
    export ELEVENLABS_API_KEY="your_api_key_here"

基础用法示例

文本转语音

python3 {baseDir}/scripts/speech.py "你好世界" -v <voice_id> -o output.mp3

生成音效:

python3 {baseDir}/scripts/sfx.py "电影爆炸声" -o boom.mp3

创作音乐:

python3 {baseDir}/scripts/music.py --prompt "轻快的电子乐前奏" --length-ms 6000 -o intro.mp3

克隆声音:

python3 {baseDir}/scripts/voiceclone.py --name "我的声音" --files sample1.mp3 sample2.mp3

查看配额:

python3 {baseDir}/scripts/quota.py --usage

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串、音效/音乐描述词、音频样本文件、语音ID、格式参数(如 mp3_44100_128、pcm_24000)、时长设置(毫秒)
输出音频文件(MP3/PCM)、JSON格式的语音列表、配额使用统计报告、新克隆语音的ID
适用人群多媒体内容创作者、播客与有声书制作团队、游戏音效设计师、广告配音需求方、需要自动化语音生成的开发者
不包含视频生成、图像处理、实时语音通话、本地离线模型运行、自动版权清理服务

 

风险提示

  • API 调用按字符数计费,需关注配额消耗
  • 克隆他人声音可能涉及法律风险,需获得授权
  • 生成内容需遵守 ElevenLabs 使用条款
  • 高采样率格式会占用更多存储空间

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/odrobnik/elevenlabs-skill/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...