ElevenLabs语音转写
音频转文字工具,支持
Inworld TTS 通过 Inworld.ai 的语音合成接口,将输入文本转换为 MP3 格式的语音文件。支持多音色选择、语速调节,以及针对长文本的流式处理模式。
前置准备
export INWORLD_API_KEY="your-base64-key-here"安装步骤
# 复制技能到目录
cp -r inworld-tts /path/to/your/skills/
# 赋予执行权限
chmod +x /path/to/your/skills/inworld-tts/scripts/tts.sh
# 可选:创建全局快捷命令
ln -sf /path/to/your/skills/inworld-tts/scripts/tts.sh /usr/local/bin/inworld-tts
基础用法
# 简单合成
./scripts/tts.sh "Hello world" output.mp3
# 指定音色和语速
./scripts/tts.sh "Hello world" output.mp3 --voice Dennis --rate 1.2
# 长文本流式处理
./scripts/tts.sh "Very long text..." output.mp3 --stream
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本字符串(支持4000+字符)、输出文件名、音色ID、语速(0.5-2.0)、温度(0.1-2.0)、模型ID、流式开关 |
| 输出 | MP3格式音频文件 |
| 适用人群 | 开发人员、语音应用构建者、内容创作者 |
| 不包含 | API Key(需自行申请)、音频播放器、商用版权授权 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/gugic/inworld-tts/SKILL.md
来源类型:开源社区技能