语音音频处理
TTS/STT/变声
该技能从GETTR帖子提取音频,使用Apple Silicon芯片上的MLX Whisper进行本地语音转写,生成带时间戳的VTT字幕文件,并将转写内容整理为要点列表或分段大纲。
安装依赖
# 安装 mlx-whisper
pip install mlx-whisper
# 安装 ffmpeg(推荐通过 Homebrew)
brew install ffmpeg
基础流程
https://gettr.com/post/p1abc2def → p1abc2def)python3 scripts/extract_gettr_og_video.py "<URL>"bash scripts/run_pipeline.sh "<VIDEO_URL>" "<SLUG>"bash scripts/run_pipeline.sh --language zh "<VIDEO_URL>" "<SLUG>"输出文件位于 ./out/gettr-transcribe-summarize/<slug>/,包含 audio.wav、audio.vtt 及后续生成的 summary.md。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | GETTR帖子URL;输出格式偏好;摘要长度;语言代码(可选) |
| 输出 | WAV音频文件、VTT字幕文件、Markdown摘要文档 |
| 适用人群 | Apple Silicon Mac用户、金融舆情分析人员、本地隐私优先用户 |
| 不包含 | 私密登录内容、自动翻译、非Apple芯片加速、实时直播 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/kevin37li/gettr-transcribe-summarize/SKILL.md
来源类型:GitHub 仓库