ElevenLabs语音合成
AI语音生成与转录工
spaces-listener 用于录制、转录和总结 X/Twitter Spaces 的实时或回放内容。通过 yt-dlp 自动下载音频,使用 Whisper 进行语音转文字,并生成 AI 摘要。
安装依赖
brew install yt-dlp ffmpeg openai-whisper
如需摘要功能,需设置环境变量 OPENAI_API_KEY;纯转录无需此配置。
基础命令
# 开始录制(后台运行)
spaces listen <url>
# 同时录制多个 Spaces
spaces listen "https://x.com/i/spaces/1ABC..."
spaces listen "https://x.com/i/spaces/2DEF..."
# 查看所有活跃录制
spaces list
# 查看指定录制状态
spaces status 1
# 停止录制
spaces stop 1
spaces stop all
# 清理残留文件
spaces clean
# 转录音频
spaces transcribe ~/Desktop/space.m4a --model medium
# 总结已有转录文本
spaces summarize ~/Desktop/space_transcript.txt
# 跳过摘要生成
spaces transcribe ~/Desktop/space.m4a --no-summarize
工作流程
spaces listen <url> 启动后台录制,立即返回spaces list重要限制:切勿为下载设置超时,Spaces 可能持续数小时,yt-dlp 会在会话结束时自动停止。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | X/Twitter Spaces URL;Whisper 模型选项(tiny/base/small/medium/large);OPENAI_API_KEY(可选,用于摘要生成) |
| 输出 | 音频文件(recording.m4a)、转录文本(transcript.txt)、内容摘要(summary.txt)、进度日志(recording.log),默认保存至 ~/Dropbox/ClawdBox/XSpaces/ |
| 适用人群 | 需要存档 Twitter Spaces 内容的用户;希望将语音转为可搜索文本的研究者;需要快速获取会议或访谈摘要的分析师 |
| 不包含 | 非 X/Twitter 平台的音频源支持;实时字幕流式输出;多语言自动识别的高级配置选项 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/jamesalmeida/spaces-listener/SKILL.md
来源类型:GitHub 仓库