思维冲击器
生成颠覆性观点与悖论
AudioPod AI 提供完整的音频处理 API,支持从文本生成音乐、说唱、器乐和人声,以及音轨分离、语音合成、音频降噪、语音转文字、说话人分离和媒体提取等功能。
音频智能处理帮助企业快速生产专业级音频内容,无需聘请音乐人或购买昂贵设备。营销团队可即时生成品牌配乐,客服部门能批量合成多语言语音,内容创作者则可一键分离音轨进行混音再创作,大幅降低音频制作门槛与成本。
落地案例:某电商企业筹备618大促,需为200款商品视频配背景音乐。运营人员使用文本描述"轻快电子乐、节奏明快、适合年轻消费者",批量生成30秒配乐并自动匹配视频时长;同时用语音合成功能为促销文案生成统一风格的AI旁白,3天内完成全部音频素材制作,较传统外包方式节省两周时间。
1. 安装 SDK
# Python
pip install audiopod
# Node.js
npm install audiopod
2. 获取 API Key
ap_ 开头)3. 初始化客户端
from audiopod import AudioPod
client = AudioPod() # 自动读取 AUDIOPOD_API_KEY 环境变量
# 或直接传入: client = AudioPod(api_key="ap_...")
4. 生成音乐示例
# 生成完整歌曲
result = client.music.song(
prompt="Upbeat pop, synth, drums, 120 bpm, female vocals",
lyrics="Verse 1:\nWalking down the street...\n\nChorus:\nWe're on fire tonight!",
duration=60
)
print(result["output_url"])
# 生成说唱
result = client.music.rap(prompt="Lo-Fi Hip Hop, male rap", lyrics="Started from...", duration=60)
# 生成纯器乐
result = client.music.instrumental(prompt="Atmospheric ambient", duration=30)
5. 异步任务处理
job = client.music.create(prompt="Chill lofi beat", duration=30, task="prompt2instrumental")
result = client.music.wait_for_completion(job["id"], timeout=600)
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本提示词(风格描述)、歌词文本、音频时长参数、API Key、YouTube/URL 链接、待处理音频文件 |
| 输出 | 生成音频下载链接、分离音轨文件、合成语音、降噪音频、转写文本、任务状态与作业ID |
| 适用人群 | 音乐创作者、视频制作者、播客主播、音频工程师、应用开发者、内容创作者 |
| 不包含 | 离线本地运行、无限免费额度、实时低延迟流处理、专业母带制作、版权音乐直接授权 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/rakesh1002/audiopod/SKILL.md
来源类型:GitHub 开源仓库