Voice.ai语音合成

15分钟前更新 1 00

多语言AI语音生成工

收录时间：

2026-02-26

手机查看

Voice.ai语音合成

技能简介

Voice.ai Voices 是基于 Voice.ai API 的高质量语音合成技能，提供9种预设人声角色与11种语言支持，支持实时流式输出与音色参数调节。

业务背景

为内容创作、客服培训、多语言产品演示等场景提供即开即用的高质量语音合成能力。无需搭建复杂TTS基础设施，通过简单命令或SDK调用即可获得自然流畅的多语种人声，大幅降低音频内容生产门槛与时间成本。

落地案例：跨境电商团队需制作法语版产品说明音频，运营人员输入"/tts –voice sophie 'Bienvenue dans notre boutique'"，选择sophie角色生成地道法语语音。技术文档团队撰写长篇教程时，启用流式模式边生成边收听，及时调整temperature参数控制朗读节奏，最终输出符合品牌调性的标准音频素材。

能做什么

将文本转换为自然语音，支持9种不同风格的人声角色
覆盖英语、西班牙语、法语、德语等11种语言的合成
启用流式模式，长文本生成时可实时收听
通过 temperature 和 top_p 参数调节语音表现力
在 OpenClaw 环境中通过聊天命令直接调用

使用说明

配置API密钥：设置环境变量 export VOICE_AI_API_KEY="your-api-key"，密钥从 Voice.ai Dashboard 获取
安装要求：无需额外安装步骤，技能已内置 Node.js CLI 和 SDK，依赖系统已安装 Node.js
OpenClaw 命令调用：
/tts <text> — 使用默认语音生成
/tts –voice ellie <text> — 指定语音角色
/tts –stream <text> — 流式生成
/voices — 查看可用语音列表

SDK 调用示例：

const client = require('./voice-ai-tts-sdk');
const audio = await client.generateSpeech({
  text: 'Hello world',
  voice_id: 'd1bf0f33-8e0e-4fbf-acf8-45c3c6262513',
  model: 'voiceai-tts-multilingual-v1-latest'
});

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本字符串；语音角色ID（9种可选）；语言代码（11种可选）；temperature/top_p调节参数；流式模式开关
输出	MP3音频文件（默认output.mp3）或流式音频数据
适用人群	内容创作者、应用开发者、OpenClaw终端用户
不包含	API密钥、离线合成能力、语音克隆功能

风险提示

需妥善保管 VOICE_AI_API_KEY，避免泄露到版本控制或日志中
仅向 https://dev.voice.ai 发送 HTTPS 请求，注意网络环境可达性
生成的音频文件默认写入 output.mp3，需确保目标路径有写入权限
非英语内容需显式指定 multilingual 模型以获得最佳效果

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/openclaw-skill-voice-ai-voices/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

Voice.ai语音合成

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

电话语音助手

X账号文风克隆

智能追问建议

CodeBuddy终端助手

贾维斯语音助手

本地语音转文字

FreshBooks账单管理

会议转录内容生成

暂无评论

标签云