文本转语音

4小时前更新 1 00

调用AI接口生成音频

收录时间：

2026-02-26

文本转语音

该技能通过调用 Hume AI 或 OpenAI 的 API，将文字内容转换为语音并生成 MP3 音频文件。

安装准备

需预先配置环境变量：HUME_API_KEY、HUME_SECRET_KEY（使用 Hume AI 时）或 OPENAI_API_KEY（使用 OpenAI 时）。确保 Node.js 运行环境已就绪。

Hume AI 用法（推荐）

HUME_API_KEY="..." HUME_SECRET_KEY="..." node {baseDir}/scripts/generate_hume_speech.js --text "要转换的文字" --output "output.mp3"

OpenAI 用法

OPENAI_API_KEY="..." node {baseDir}/scripts/generate_speech.js --text "要转换的文字" --output "output.mp3"

执行后脚本会输出 MEDIA: 开头的行，包含生成文件的完整路径。使用 message 工具将该文件发送给用户。

见下方输入与输出表格。

项目	内容
输入	文字字符串、输出文件名、HUME_API_KEY/HUME_SECRET_KEY 或 OPENAI_API_KEY
输出	MP3格式音频文件，脚本返回 MEDIA: 前缀的绝对路径
适用人群	需要语音合成功能的开发者、构建多模态交互产品的团队
不包含	实时语音流、离线合成能力、内置语音播放功能

原始链接：https://github.com/openclaw/skills/tree/main/skills/amstko/tts/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论...