OpenAI语音转写
调用Whisper
该技能从视频或音频文件生成电影风格字幕,支持希伯来语与英语自动识别、互译及硬编码烧录。
安装依赖
# 安装 uv 包管理器与完整版 ffmpeg
curl -LsSf https://astral.sh/uv/install.sh | sh
brew install ffmpeg-full
基础用法
# 纯文本转录输出到终端
./scripts/generate_srt.py video.mp4
# 生成 SRT 字幕文件
./scripts/generate_srt.py video.mp4 --srt
# 烧录硬字幕(永久显示)
./scripts/generate_srt.py video.mp4 --srt --burn
# 翻译为英语并烧录
./scripts/generate_srt.py video.mp4 --srt --burn --translate en
# 强制指定输入语言
./scripts/generate_srt.py video.mp4 --lang he # 希伯来语
./scripts/generate_srt.py video.mp4 --lang en # 英语
常用选项
--srt:生成 SRT 文件--burn:硬编码烧录字幕--embed:嵌入可开关的软字幕--translate en:翻译为英语-o FILE:自定义输出路径见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 视频或音频文件;可选参数:–lang 强制语言、–translate 翻译指令、–srt/–burn/–embed 输出格式控制 |
| 输出 | 纯文本/SRT文件/烧录后视频;字幕样式为白字黑边、底部对齐、每行≤42字符 |
| 适用人群 | 内容创作者、社交媒体运营、影视后期人员、播客制作者、希伯来语-英语双语用户 |
| 不包含 | 实时字幕、说话人分离、希伯来语/英语以外语种、可视化时间轴编辑器 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/ngutman/video-subtitles/SKILL.md
来源类型:GitHub 仓库