YouTube语音摘要
视频转播客式语音摘要
openai-whisper 是基于 OpenAI Whisper 模型的本地语音转文字工具,通过命令行直接调用,无需联网或 API 密钥即可将音频文件转换为文本。
安装指令
brew install openai-whisper
基础用法
# 标准转录
whisper /path/audio.mp3 --model medium --output_format txt --output_dir .
# 翻译为英文并输出字幕
whisper /path/audio.m4a --task translate --output_format srt
注意事项
~/.cache/whisper见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 本地音频文件路径;可选参数:模型大小(tiny/base/small/medium/large/turbo)、任务类型(transcribe/translate)、输出格式(txt/srt/vtt/json/tsv) |
| 输出 | 指定格式的文本文件,默认保存至当前目录或 –output_dir 指定路径 |
| 适用人群 | 内容创作者、研究人员、需要离线语音处理的开发者、注重隐私的个人用户 |
| 不包含 | 实时流式识别、云端服务、可视化操作界面、商业授权的技术支持 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/steipete/openai-whisper/SKILL.md
来源类型:GitHub 仓库