AI语音合成

4天前更新 1 00

多语言实时语音生成工

收录时间：

2026-02-26

手机查看

AI语音合成

技能简介

Voice.ai Voices 是基于 Voice.ai API 的高质量语音合成技能，内置9种角色音色与11种语言支持，提供实时流式输出与可定制的语音参数调节。

能做什么

将文本转换为自然语音，支持9种预设角色音色
覆盖11种语言的跨语言合成
启用流式模式实现长文本的实时音频输出
通过温度与top_p参数调节语音表现力
在 OpenClaw 环境中通过聊天命令直接调用

使用说明

环境配置

export VOICE_AI_API_KEY="your-api-key"

从 Voice.ai Dashboard 获取 API 密钥。

安装要求

无需额外安装步骤。本技能已捆绑 Node.js CLI 与 SDK，无外部 npm 依赖，但需确保系统已安装 Node.js 运行时。

OpenClaw 命令用法

/tts Hello, welcome to Voice.ai!
/tts --voice oliver Good morning, everyone.
/tts --voice lilith --stream This is a long story...
/voices

SDK 编程调用

const audio = await client.generateSpeech({
  text: 'Bonjour le monde!',
  voice_id: 'ellie-voice-id',
  model: 'voiceai-tts-multilingual-v1-latest',
  language: 'fr',
  temperature: 1.8,
  top_p: 0.9
});

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本内容、音色ID（如 ellie/oliver）、模型类型、语言代码、温度参数(0-2)、top_p参数(0-1)、是否流式
输出	MP3音频文件或实时流式音频数据
适用人群	需要快速生成多语言语音的内容团队、OpenClaw 自动化工作流用户、集成TTS功能的应用开发者
不包含	离线运行能力、个人声音克隆、企业级SLA保障、音频后期编辑功能

风险提示

需妥善保管 VOICE_AI_API_KEY，避免泄露至版本控制或日志
仅向 https://dev.voice.ai 发起出站 HTTPS 请求，注意网络白名单配置
音频文件默认写入 output.mp3，需确保目标路径有写入权限
非英语内容需显式指定 multilingual 模型与语言代码
高 temperature 值可能导致语音一致性下降

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/voice-ai-voices/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

AI语音合成

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

飞书任务管理

Instapaper书签管理

新闻API搜索

Dokploy部署管理

EchoDecks抽认卡管理

Fliz视频生成API

语音笔记同步

语音合成服务

暂无评论

标签云