Kokoro语音合成

4天前更新 3 00
Kokoro语音合成Kokoro语音合成
Kokoro语音合成

技能简介

Kokoro TTS 是一个基于本地或远程 Kokoro-TTS 实例的语音合成工具,可将文本转换为高质量 AI 语音。

能做什么

  • 将任意文本转换为 MP3 格式语音文件
  • 支持多种音色选择(男声、女声、英式发音等)
  • 可调节语速(0.25 至 4.0 倍速)
  • 输出自动识别为媒体附件发送

使用说明

安装与配置

  1. 确保已部署 Kokoro-TTS 服务(本地默认端口 8880)
  2. 克隆技能仓库后,在 .env 文件中配置 API 地址:
    KOKORO_API_URL=http://localhost:8880/v1/audio/speech
  3. 安装 Node.js 依赖(如需要)

运行指令

node skills/kokoro-tts/scripts/tts.js "<文本>" [音色] [语速]

参数说明:

  • <文本>:待转换文本,需用引号包裹
  • [音色]:可选,默认 af_heart(温暖女声)
  • [语速]:可选,默认 1.0

常用音色

  • af_heart – 温暖女声(默认)
  • af_nova – 专业女声
  • am_adam – 低沉男声
  • bf_alice – 英式女声

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串(必需)、音色ID(可选,默认af_heart)、语速(可选,默认1.0)
输出MP3音频文件,控制台输出格式:MEDIA: media/tts_[时间戳].mp3
适用人群需要本地部署TTS的开发者、隐私敏感场景用户、多语言配音工作者
不包含云端API密钥管理、语音克隆功能、SSML标记支持、实时WebSocket流

 

风险提示

  • 需提前部署 Kokoro-TTS 后端服务,否则无法调用
  • 长文本可能受 API 长度限制,建议分段处理
  • 生成文件存储于 media/ 目录,注意磁盘空间管理
  • 远程 API 地址需确保网络可达

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/edkief/kokoro-tts/SKILL.md
来源类型:GitHub 开源技能

数据统计

相关导航

暂无评论

none
暂无评论...