电话语音助手
Twilio电话接入
Voice.ai Voices 是基于 Voice.ai API 的高质量语音合成技能,提供9种预设人声角色与11种语言支持,支持实时流式输出与音色参数调节。
为内容创作、客服培训、多语言产品演示等场景提供即开即用的高质量语音合成能力。无需搭建复杂TTS基础设施,通过简单命令或SDK调用即可获得自然流畅的多语种人声,大幅降低音频内容生产门槛与时间成本。
落地案例:跨境电商团队需制作法语版产品说明音频,运营人员输入"/tts –voice sophie 'Bienvenue dans notre boutique'",选择sophie角色生成地道法语语音。技术文档团队撰写长篇教程时,启用流式模式边生成边收听,及时调整temperature参数控制朗读节奏,最终输出符合品牌调性的标准音频素材。
export VOICE_AI_API_KEY="your-api-key",密钥从 Voice.ai Dashboard 获取const client = require('./voice-ai-tts-sdk');
const audio = await client.generateSpeech({
text: 'Hello world',
voice_id: 'd1bf0f33-8e0e-4fbf-acf8-45c3c6262513',
model: 'voiceai-tts-multilingual-v1-latest'
});
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本字符串;语音角色ID(9种可选);语言代码(11种可选);temperature/top_p调节参数;流式模式开关 |
| 输出 | MP3音频文件(默认output.mp3)或流式音频数据 |
| 适用人群 | 内容创作者、应用开发者、OpenClaw终端用户 |
| 不包含 | API密钥、离线合成能力、语音克隆功能 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/openclaw-skill-voice-ai-voices/SKILL.md
来源类型:GitHub 仓库