Inworld语音合成

5天前更新 1 00

调用Inworld.

收录时间：

2026-02-26

手机查看

Inworld语音合成

技能简介

Inworld TTS 通过 Inworld.ai 的语音合成接口，将输入文本转换为 MP3 格式的语音文件。支持多音色选择、语速调节，以及针对长文本的流式处理模式。

能做什么

将任意文本内容合成为自然语音
调整说话人音色与语速参数
处理超过4000字符的长文本（流式模式）
生成可直接播放的 MP3 音频文件

使用说明

前置准备

访问 Inworld 平台注册账号
创建 API Key，勾选 “Voices: Read” 权限
复制 Basic (Base64) 格式的密钥
设置环境变量：export INWORLD_API_KEY="your-base64-key-here"

安装步骤

# 复制技能到目录
cp -r inworld-tts /path/to/your/skills/

# 赋予执行权限
chmod +x /path/to/your/skills/inworld-tts/scripts/tts.sh

# 可选：创建全局快捷命令
ln -sf /path/to/your/skills/inworld-tts/scripts/tts.sh /usr/local/bin/inworld-tts

基础用法

# 简单合成
./scripts/tts.sh "Hello world" output.mp3

# 指定音色和语速
./scripts/tts.sh "Hello world" output.mp3 --voice Dennis --rate 1.2

# 长文本流式处理
./scripts/tts.sh "Very long text..." output.mp3 --stream

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本字符串（支持4000+字符）、输出文件名、音色ID、语速(0.5-2.0)、温度(0.1-2.0)、模型ID、流式开关
输出	MP3格式音频文件
适用人群	开发人员、语音应用构建者、内容创作者
不包含	API Key（需自行申请）、音频播放器、商用版权授权

风险提示

需妥善保管 API Key，避免泄露导致额度被盗用
流式模式依赖 jq 的 –unbuffered 支持，部分旧版本可能不兼容
免费账户存在调用频次限制，高频场景需关注配额
生成音频的版权归属需遵循 Inworld 平台服务条款

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/gugic/inworld-tts/SKILL.md
来源类型：开源社区技能

数据统计

暂无评论

暂无评论...

Inworld语音合成

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

ElevenLabs语音转写

薄伽梵歌日颂

Plaud录音数据访问

Deepdub语音合成

YouTube数据提取

屏幕实时解说

对话摘要生成

对话内容摘要

暂无评论

标签云