Windows语音合成
SAPI5轻量TTS
该技能通过调用 Hume AI 或 OpenAI 的 API,将文字内容转换为语音并生成 MP3 音频文件。
安装准备
需预先配置环境变量:HUME_API_KEY、HUME_SECRET_KEY(使用 Hume AI 时)或 OPENAI_API_KEY(使用 OpenAI 时)。确保 Node.js 运行环境已就绪。
Hume AI 用法(推荐)
HUME_API_KEY="..." HUME_SECRET_KEY="..." node {baseDir}/scripts/generate_hume_speech.js --text "要转换的文字" --output "output.mp3"
OpenAI 用法
OPENAI_API_KEY="..." node {baseDir}/scripts/generate_speech.js --text "要转换的文字" --output "output.mp3"
执行后脚本会输出 MEDIA: 开头的行,包含生成文件的完整路径。使用 message 工具将该文件发送给用户。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文字字符串、输出文件名、HUME_API_KEY/HUME_SECRET_KEY 或 OPENAI_API_KEY |
| 输出 | MP3格式音频文件,脚本返回 MEDIA: 前缀的绝对路径 |
| 适用人群 | 需要语音合成功能的开发者、构建多模态交互产品的团队 |
| 不包含 | 实时语音流、离线合成能力、内置语音播放功能 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/amstko/tts/SKILL.md
来源类型:GitHub 仓库