文本转语音

4小时前更新 1 00
文本转语音文本转语音
文本转语音

技能简介

该技能通过调用 Hume AI 或 OpenAI 的 API,将文字内容转换为语音并生成 MP3 音频文件。

能做什么

  • 根据输入文字生成自然语音音频
  • 支持 Hume AI(推荐)和 OpenAI 两种服务
  • 输出标准 MP3 格式文件
  • 返回文件的绝对路径供后续使用

使用说明

安装准备

需预先配置环境变量:HUME_API_KEY、HUME_SECRET_KEY(使用 Hume AI 时)或 OPENAI_API_KEY(使用 OpenAI 时)。确保 Node.js 运行环境已就绪。

Hume AI 用法(推荐)

HUME_API_KEY="..." HUME_SECRET_KEY="..." node {baseDir}/scripts/generate_hume_speech.js --text "要转换的文字" --output "output.mp3"

OpenAI 用法

OPENAI_API_KEY="..." node {baseDir}/scripts/generate_speech.js --text "要转换的文字" --output "output.mp3"

执行后脚本会输出 MEDIA: 开头的行,包含生成文件的完整路径。使用 message 工具将该文件发送给用户。

输入与输出

见下方输入与输出表格。

项目内容
输入文字字符串、输出文件名、HUME_API_KEY/HUME_SECRET_KEY 或 OPENAI_API_KEY
输出MP3格式音频文件,脚本返回 MEDIA: 前缀的绝对路径
适用人群需要语音合成功能的开发者、构建多模态交互产品的团队
不包含实时语音流、离线合成能力、内置语音播放功能

 

风险提示

  • API 密钥需妥善保管,避免泄露
  • 生成内容受各平台服务条款约束
  • 网络异常可能导致请求失败
  • 长文本可能产生较高费用

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/amstko/tts/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...