语音合成工作室语音合成工作室
语音合成工作室

技能简介

ClawVox 是基于 ElevenLabs API 的 OpenClaw 语音工作室,提供文本转语音、语音转文本、声音克隆音效生成及音频翻译等功能。

业务背景

ClawVox 语音工作室为企业提供一站式音频内容生产能力,无需专业录音设备即可生成多语言语音素材。支持声音克隆与音效合成,帮助品牌打造统一听觉识别系统。音频翻译功能助力内容快速本地化,降低跨国业务的多语言制作门槛,提升营销素材产出效率。

落地案例:某在线教育平台需为多门课程制作英文、西班牙语及日语版本。传统方式需聘请多国配音员,周期长成本高。使用 ClawVox 后,团队先用主讲人30分钟音频样本克隆专属声音模型,再将中文课件文本批量转为目标语言语音,配合环境音效生成完整课程音频。原本两周的本地化工作压缩至两天完成,且保持了品牌声音的一致性。

能做什么

  • 将文本转换为自然语音,支持32种语言
  • 从音频样本克隆自定义声音
  • 将语音录音转为文字
  • 根据文字描述生成环境音效
  • 翻译并配音音频内容
  • 去除音频背景噪音

使用说明

安装前提

系统需安装 curl 和 jq。

配置步骤

  1. 访问 elevenlabs.io 获取 API 密钥
  2. 设置环境变量:export ELEVENLABS_API_KEY="your_api_key_here"
  3. 或在配置文件 ~/.openclaw/openclaw.json 中添加技能配置

常用命令

  • 文本转语音:{baseDir}/scripts/speak.sh '要朗读的文字'
  • 语音转文本:{baseDir}/scripts/transcribe.sh audio.mp3
  • 克隆声音:{baseDir}/scripts/clone.sh --name "MyVoice" sample.mp3
  • 生成音效:{baseDir}/scripts/sfx.sh "thunder storm"
  • 列出可用声音:{baseDir}/scripts/voices.sh list

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串、音频文件(MP3/WAV/M4A等)、声音样本(建议30秒以上)、ElevenLabs API密钥
输出MP3格式语音文件、TXT格式转录文本、自定义克隆声音、WAV/MP3音效文件
适用人群内容创作者、播客制作人、有声书开发者、多语言本地化团队、游戏音效设计师
不包含视频生成功能、实时变声处理、离线运行能力、免费无限API额度

 

风险提示

  • 需要有效的 ElevenLabs API 密钥,使用会产生费用
  • 克隆他人声音需获得授权,避免法律风险
  • 音频文件大小限制为100MB
  • 网络连接不稳定可能导致生成失败
  • API 调用频率受 ElevenLabs 账户等级限制

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/abhishek-official1/clawvox/SKILL.md
来源类型:GitHub 开源项目

数据统计

相关导航

暂无评论

none
暂无评论...