AI语音合成

4天前更新 1 00
AI语音合成AI语音合成
AI语音合成

技能简介

Voice.ai Voices 是基于 Voice.ai API 的高质量语音合成技能,内置9种角色音色与11种语言支持,提供实时流式输出与可定制的语音参数调节。

能做什么

  • 将文本转换为自然语音,支持9种预设角色音色
  • 覆盖11种语言的跨语言合成
  • 启用流式模式实现长文本的实时音频输出
  • 通过温度与top_p参数调节语音表现力
  • OpenClaw 环境中通过聊天命令直接调用

使用说明

环境配置

export VOICE_AI_API_KEY="your-api-key"

Voice.ai Dashboard 获取 API 密钥。

安装要求

无需额外安装步骤。本技能已捆绑 Node.js CLI 与 SDK,无外部 npm 依赖,但需确保系统已安装 Node.js 运行时。

OpenClaw 命令用法

/tts Hello, welcome to Voice.ai!
/tts --voice oliver Good morning, everyone.
/tts --voice lilith --stream This is a long story...
/voices

SDK 编程调用

const audio = await client.generateSpeech({
  text: 'Bonjour le monde!',
  voice_id: 'ellie-voice-id',
  model: 'voiceai-tts-multilingual-v1-latest',
  language: 'fr',
  temperature: 1.8,
  top_p: 0.9
});

输入与输出

见下方输入与输出表格。

项目内容
输入文本内容、音色ID(如 ellie/oliver)、模型类型、语言代码、温度参数(0-2)、top_p参数(0-1)、是否流式
输出MP3音频文件或实时流式音频数据
适用人群需要快速生成多语言语音的内容团队、OpenClaw 自动化工作流用户、集成TTS功能的应用开发者
不包含离线运行能力、个人声音克隆、企业级SLA保障、音频后期编辑功能

 

风险提示

  • 需妥善保管 VOICE_AI_API_KEY,避免泄露至版本控制或日志
  • 仅向 https://dev.voice.ai 发起出站 HTTPS 请求,注意网络白名单配置
  • 音频文件默认写入 output.mp3,需确保目标路径有写入权限
  • 非英语内容需显式指定 multilingual 模型与语言代码
  • 高 temperature 值可能导致语音一致性下降

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/voice-ai-voices/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...