Voice.ai语音合成

15分钟前更新 1 00
Voice.ai语音合成Voice.ai语音合成
Voice.ai语音合成

技能简介

Voice.ai Voices 是基于 Voice.ai API 的高质量语音合成技能,提供9种预设人声角色与11种语言支持,支持实时流式输出与音色参数调节。

业务背景

为内容创作、客服培训、多语言产品演示等场景提供即开即用的高质量语音合成能力。无需搭建复杂TTS基础设施,通过简单命令或SDK调用即可获得自然流畅的多语种人声,大幅降低音频内容生产门槛与时间成本。

落地案例:跨境电商团队需制作法语版产品说明音频,运营人员输入"/tts –voice sophie 'Bienvenue dans notre boutique'",选择sophie角色生成地道法语语音。技术文档团队撰写长篇教程时,启用流式模式边生成边收听,及时调整temperature参数控制朗读节奏,最终输出符合品牌调性的标准音频素材。

能做什么

  • 将文本转换为自然语音,支持9种不同风格的人声角色
  • 覆盖英语、西班牙语、法语、德语等11种语言的合成
  • 启用流式模式,长文本生成时可实时收听
  • 通过 temperature 和 top_p 参数调节语音表现力
  • OpenClaw 环境中通过聊天命令直接调用

使用说明

  1. 配置API密钥:设置环境变量 export VOICE_AI_API_KEY="your-api-key",密钥从 Voice.ai Dashboard 获取
  2. 安装要求:无需额外安装步骤,技能已内置 Node.js CLI 和 SDK,依赖系统已安装 Node.js
  3. OpenClaw 命令调用
    /tts <text> — 使用默认语音生成
    /tts –voice ellie <text> — 指定语音角色
    /tts –stream <text> — 流式生成
    /voices — 查看可用语音列表
  4. SDK 调用示例
    const client = require('./voice-ai-tts-sdk');
    const audio = await client.generateSpeech({
      text: 'Hello world',
      voice_id: 'd1bf0f33-8e0e-4fbf-acf8-45c3c6262513',
      model: 'voiceai-tts-multilingual-v1-latest'
    });

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串;语音角色ID(9种可选);语言代码(11种可选);temperature/top_p调节参数;流式模式开关
输出MP3音频文件(默认output.mp3)或流式音频数据
适用人群内容创作者、应用开发者、OpenClaw终端用户
不包含API密钥、离线合成能力、语音克隆功能

 

风险提示

  • 需妥善保管 VOICE_AI_API_KEY,避免泄露到版本控制或日志中
  • 仅向 https://dev.voice.ai 发送 HTTPS 请求,注意网络环境可达性
  • 生成的音频文件默认写入 output.mp3,需确保目标路径有写入权限
  • 非英语内容需显式指定 multilingual 模型以获得最佳效果

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/openclaw-skill-voice-ai-voices/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...