音效生成器

4小时前更新 1 00

文本生成短音效并转码

收录时间:
2026-02-26
音效生成器音效生成器
音效生成器

技能简介

基于 ElevenLabs SFX API 的文本转音效工具,可将文字描述转换为掌声、笑声、呼啸声、环境音等短音频片段,支持输出 MP3 或转换为 WhatsApp 兼容的 OGG/Opus 格式。

能做什么

  • 根据文本提示生成 0.5-30 秒的定制音效
  • 自动输出标准 MP3 格式文件
  • 通过 FFmpeg 转码为移动端友好的 OGG/Opus 格式
  • 适用于消息应用自动附件场景

使用说明

安装与配置

  1. 获取 ElevenLabs API 密钥
  2. 配置环境变量(任选其一):
    • 系统环境变量:ELEVENLABS_API_KEYXI_API_KEY
    • 配置文件:~/.clawdbot/clawdbot.json 中设置 skills."sound-fx".env.ELEVENLABS_API_KEY
  3. 确保已安装 ffmpeg(用于格式转换)

生成音效

scripts/generate_sfx.sh --text "short audience applause" --out "/tmp/applause.mp3" --duration 1.2

转码为 WhatsApp 格式

ffmpeg -y -i /tmp/applause.mp3 -c:a libopus -b:a 48k /tmp/applause.ogg

常用示例

  • 掌声:--text "short audience applause"
  • 笑声:--text "canned audience laughter"
  • 呼啸:--text "fast whoosh"
  • 雨声:--text "soft rain ambience"

输入与输出

见下方输入与输出表格。

项目内容
输入文本描述(音效类型)、可选时长参数、输出文件路径、ElevenLabs API密钥
输出MP3格式音频文件;可选OGG/Opus格式;控制台输出MEDIA路径标识
适用人群内容创作者、聊天机器人开发者、短视频编辑者、需要标准音效的开发者
不包含音乐旋律生成、长音频合成、实时音频流、声音克隆、视频生成

 

风险提示

  • 需有效 ElevenLabs API 密钥,调用产生费用
  • 生成内容受 ElevenLabs 使用政策约束
  • 时长参数超出 0.5-30 秒范围可能导致失败
  • FFmpeg 未安装时无法完成格式转换
  • 网络不稳定可能影响 API 响应

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/javicasper/sound-fx/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...