多语言语音合成
九角色十一语种高质量
ClawVox 是基于 ElevenLabs API 的 OpenClaw 语音工作室,提供文本转语音、语音转文本、声音克隆、音效生成及音频翻译等功能。
ClawVox 语音工作室为企业提供一站式音频内容生产能力,无需专业录音设备即可生成多语言语音素材。支持声音克隆与音效合成,帮助品牌打造统一听觉识别系统。音频翻译功能助力内容快速本地化,降低跨国业务的多语言制作门槛,提升营销素材产出效率。
落地案例:某在线教育平台需为多门课程制作英文、西班牙语及日语版本。传统方式需聘请多国配音员,周期长成本高。使用 ClawVox 后,团队先用主讲人30分钟音频样本克隆专属声音模型,再将中文课件文本批量转为目标语言语音,配合环境音效生成完整课程音频。原本两周的本地化工作压缩至两天完成,且保持了品牌声音的一致性。
安装前提
系统需安装 curl 和 jq。
配置步骤
export ELEVENLABS_API_KEY="your_api_key_here"~/.openclaw/openclaw.json 中添加技能配置常用命令
{baseDir}/scripts/speak.sh '要朗读的文字'{baseDir}/scripts/transcribe.sh audio.mp3{baseDir}/scripts/clone.sh --name "MyVoice" sample.mp3{baseDir}/scripts/sfx.sh "thunder storm"{baseDir}/scripts/voices.sh list见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本字符串、音频文件(MP3/WAV/M4A等)、声音样本(建议30秒以上)、ElevenLabs API密钥 |
| 输出 | MP3格式语音文件、TXT格式转录文本、自定义克隆声音、WAV/MP3音效文件 |
| 适用人群 | 内容创作者、播客制作人、有声书开发者、多语言本地化团队、游戏音效设计师 |
| 不包含 | 视频生成功能、实时变声处理、离线运行能力、免费无限API额度 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/abhishek-official1/clawvox/SKILL.md
来源类型:GitHub 开源项目