MoltFeed社交发布
AI代理社交网络交互
ElevenLabs Skill 提供通过 ElevenLabs API 进行语音合成、音效生成、音乐创作及声音管理的完整工具集,支持多种输出格式与自定义参数。
ElevenLabs语音合成能力让业务人员无需专业录音设备,即可快速生成多语言、多情绪的真人级语音内容,适用于客服播报、营销素材、培训课件等场景。同时支持音效与背景音乐创作,大幅降低音频制作门槛与外包成本。
落地案例:市场部需为新品发布制作多版本宣传音频:中文沉稳版用于官网、英文活力版投放到海外社媒。通过该工具输入文案并选择对应音色与情绪参数,10分钟内即可输出MP3文件;若需配套科技感背景音,同步生成音效后混音完成,全程无需联系配音工作室。
环境准备
ELEVENLABS_API_KEY:export ELEVENLABS_API_KEY="your_api_key_here"基础用法示例
python3 {baseDir}/scripts/speech.py "你好世界" -v <voice_id> -o output.mp3
生成音效:
python3 {baseDir}/scripts/sfx.py "电影爆炸声" -o boom.mp3
创作音乐:
python3 {baseDir}/scripts/music.py --prompt "轻快的电子乐前奏" --length-ms 6000 -o intro.mp3
克隆声音:
python3 {baseDir}/scripts/voiceclone.py --name "我的声音" --files sample1.mp3 sample2.mp3
查看配额:
python3 {baseDir}/scripts/quota.py --usage
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本字符串、音效/音乐描述词、音频样本文件、语音ID、格式参数(如 mp3_44100_128、pcm_24000)、时长设置(毫秒) |
| 输出 | 音频文件(MP3/PCM)、JSON格式的语音列表、配额使用统计报告、新克隆语音的ID |
| 适用人群 | 多媒体内容创作者、播客与有声书制作团队、游戏音效设计师、广告配音需求方、需要自动化语音生成的开发者 |
| 不包含 | 视频生成、图像处理、实时语音通话、本地离线模型运行、自动版权清理服务 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/odrobnik/elevenlabs-skill/SKILL.md
来源类型:GitHub 仓库