AI音频内容生成

2小时前更新 6 00

一键生成有声书与播客

收录时间：

2026-02-26

语音与翻译 # claude # ElevenLabs # 播客制作 # 文本转语音 # 有声书 # 音频生成

AI音频内容生成

AI音频内容生成

技能简介

audio-gen 是一款自动化音频内容生产工具，结合 Claude AI 的脚本创作能力与 ElevenLabs 的高质量语音合成技术，将用户提供的主题或创意转化为完整的有声书章节、播客节目或教育音频。

能做什么

根据主题自动生成叙事脚本，支持有声书、播客、教育三种格式
智能计算字数与时长对应关系（约75词/分钟）
在脚本中嵌入停顿标记与情绪指令，优化语音表现
调用 ElevenLabs API 输出 MP3 音频文件
支持2-30分钟灵活时长，推荐5-15分钟为最佳体验

使用说明

安装准备

本技能依赖外部服务，需配置以下环境变量：

ANTHROPIC_API_KEY=你的Claude API密钥
ELEVENLABS_API_KEY=你的ElevenLabs API密钥

同时需要前置安装 sag 技能作为依赖。

使用步骤

向 Claude 描述音频需求：格式类型（有声书/播客/教育）、主题、目标时长、风格偏好
Claude 解析请求后计算目标字数（分钟数×75），生成带停顿标记的完整脚本
审阅脚本并确认，或要求调整内容、长度、语气
确认后通过 MEDIA token 接收生成的 MP3 文件

示例指令

"创建一个5分钟的有声书章节，关于一只龙发现友谊的故事"
"制作一期10分钟的咖啡历史播客"
"生成15分钟的教育音频，讲解神经网络工作原理"

输入与输出

见下方输入与输出表格。

项目	内容
输入	自然语言描述的主题、格式类型、目标时长、风格偏好
输出	MP3 音频文件（MEDIA token 形式）+ 预览脚本
适用人群	内容创作者、教育工作者、播客制作人、有声书作者、企业培训师
不包含	视频生成、多语言翻译、真人配音、音频剪辑、版权音乐

风险提示

API 密钥泄露风险：ANTHROPIC_API_KEY 和 ELEVENLABS_API_KEY 需妥善保管，避免硬编码提交至代码仓库
内容合规风险：AI 生成脚本需人工审核，避免版权争议或不当内容传播
服务可用性风险：依赖 ElevenLabs 与 Anthropic 第三方服务，存在接口变更或额度限制可能
语音效果限制：部分复杂标点（分号）和数字格式（阿拉伯数字）需预处理，否则影响朗读质量

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/udiedrichsen/audio-gen/SKILL.md
来源类型：GitHub 开源技能

数据统计

相关导航

AI播客生成

文本转实时音频叙事

Claude团队

多Claude协同工作

X空间录音转录

录制并转录Twitt

EachLabs语音转写

音频URL转文字服务

API限流监控

实时追踪Claude

音视频转录工具

YouTube与本地

Edge语音合成

文本转语音生成工具

屏幕实时解说

macOS屏幕活动A

暂无评论

none

暂无评论...