Inworld语音合成Inworld语音合成
Inworld语音合成

技能简介

Inworld TTS 通过 Inworld.ai 的语音合成接口,将输入文本转换为 MP3 格式的语音文件。支持多音色选择、语速调节,以及针对长文本的流式处理模式。

能做什么

  • 将任意文本内容合成为自然语音
  • 调整说话人音色与语速参数
  • 处理超过4000字符的长文本(流式模式)
  • 生成可直接播放的 MP3 音频文件

使用说明

前置准备

  1. 访问 Inworld 平台 注册账号
  2. 创建 API Key,勾选 “Voices: Read” 权限
  3. 复制 Basic (Base64) 格式的密钥
  4. 设置环境变量:export INWORLD_API_KEY="your-base64-key-here"

安装步骤

# 复制技能到目录
cp -r inworld-tts /path/to/your/skills/

# 赋予执行权限
chmod +x /path/to/your/skills/inworld-tts/scripts/tts.sh

# 可选:创建全局快捷命令
ln -sf /path/to/your/skills/inworld-tts/scripts/tts.sh /usr/local/bin/inworld-tts

基础用法

# 简单合成
./scripts/tts.sh "Hello world" output.mp3

# 指定音色和语速
./scripts/tts.sh "Hello world" output.mp3 --voice Dennis --rate 1.2

# 长文本流式处理
./scripts/tts.sh "Very long text..." output.mp3 --stream

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串(支持4000+字符)、输出文件名、音色ID、语速(0.5-2.0)、温度(0.1-2.0)、模型ID、流式开关
输出MP3格式音频文件
适用人群开发人员、语音应用构建者、内容创作者
不包含API Key(需自行申请)、音频播放器、商用版权授权

 

风险提示

  • 需妥善保管 API Key,避免泄露导致额度被盗用
  • 流式模式依赖 jq 的 –unbuffered 支持,部分旧版本可能不兼容
  • 免费账户存在调用频次限制,高频场景需关注配额
  • 生成音频的版权归属需遵循 Inworld 平台服务条款

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gugic/inworld-tts/SKILL.md
来源类型:开源社区技能

数据统计

相关导航

暂无评论

none
暂无评论...