AI音频内容生成

2小时前更新 6 00
AI音频内容生成AI音频内容生成
AI音频内容生成

技能简介

audio-gen 是一款自动化音频内容生产工具,结合 Claude AI 的脚本创作能力与 ElevenLabs 的高质量语音合成技术,将用户提供的主题或创意转化为完整的有声书章节、播客节目或教育音频。

能做什么

  • 根据主题自动生成叙事脚本,支持有声书、播客、教育三种格式
  • 智能计算字数与时长对应关系(约75词/分钟)
  • 在脚本中嵌入停顿标记与情绪指令,优化语音表现
  • 调用 ElevenLabs API 输出 MP3 音频文件
  • 支持2-30分钟灵活时长,推荐5-15分钟为最佳体验

使用说明

安装准备

本技能依赖外部服务,需配置以下环境变量:

ANTHROPIC_API_KEY=你的Claude API密钥
ELEVENLABS_API_KEY=你的ElevenLabs API密钥

同时需要前置安装 sag 技能作为依赖。

使用步骤

  1. 向 Claude 描述音频需求:格式类型(有声书/播客/教育)、主题、目标时长、风格偏好
  2. Claude 解析请求后计算目标字数(分钟数×75),生成带停顿标记的完整脚本
  3. 审阅脚本并确认,或要求调整内容、长度、语气
  4. 确认后通过 MEDIA token 接收生成的 MP3 文件

示例指令

"创建一个5分钟的有声书章节,关于一只龙发现友谊的故事"
"制作一期10分钟的咖啡历史播客"
"生成15分钟的教育音频,讲解神经网络工作原理"

输入与输出

见下方输入与输出表格。

项目内容
输入自然语言描述的主题、格式类型、目标时长、风格偏好
输出MP3 音频文件(MEDIA token 形式)+ 预览脚本
适用人群内容创作者、教育工作者、播客制作人、有声书作者、企业培训师
不包含视频生成、多语言翻译、真人配音、音频剪辑、版权音乐

 

风险提示

  • API 密钥泄露风险:ANTHROPIC_API_KEY 和 ELEVENLABS_API_KEY 需妥善保管,避免硬编码提交至代码仓库
  • 内容合规风险:AI 生成脚本需人工审核,避免版权争议或不当内容传播
  • 服务可用性风险:依赖 ElevenLabs 与 Anthropic 第三方服务,存在接口变更或额度限制可能
  • 语音效果限制:部分复杂标点(分号)和数字格式(阿拉伯数字)需预处理,否则影响朗读质量

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/udiedrichsen/audio-gen/SKILL.md
来源类型:GitHub 开源技能

数据统计

相关导航

暂无评论

none
暂无评论...