视频字幕生成

4小时前更新 1 00
视频字幕生成视频字幕生成
视频字幕生成

技能简介

该技能从视频或音频文件生成电影风格字幕,支持希伯来语与英语自动识别、互译及硬编码烧录。

能做什么

  • 高精度转录希伯来语(ivrit.ai 微调模型)与英语(Whisper large-v3)
  • 自动检测语言并匹配最佳模型
  • 将希伯来语音频翻译为英语字幕
  • 生成独立 SRT 文件或嵌入软字幕
  • 硬编码烧录字幕至视频(WhatsApp 等全平台可见)
  • 输出电影级排版:每行最多42字符、1-7秒时长、自然断句

使用说明

安装依赖

# 安装 uv 包管理器与完整版 ffmpeg
curl -LsSf https://astral.sh/uv/install.sh | sh
brew install ffmpeg-full

基础用法

# 纯文本转录输出到终端
./scripts/generate_srt.py video.mp4

# 生成 SRT 字幕文件
./scripts/generate_srt.py video.mp4 --srt

# 烧录硬字幕(永久显示)
./scripts/generate_srt.py video.mp4 --srt --burn

# 翻译为英语并烧录
./scripts/generate_srt.py video.mp4 --srt --burn --translate en

# 强制指定输入语言
./scripts/generate_srt.py video.mp4 --lang he  # 希伯来语
./scripts/generate_srt.py video.mp4 --lang en  # 英语

常用选项

  • --srt:生成 SRT 文件
  • --burn:硬编码烧录字幕
  • --embed:嵌入可开关的软字幕
  • --translate en:翻译为英语
  • -o FILE:自定义输出路径

输入与输出

见下方输入与输出表格。

项目内容
输入视频或音频文件;可选参数:–lang 强制语言、–translate 翻译指令、–srt/–burn/–embed 输出格式控制
输出纯文本/SRT文件/烧录后视频;字幕样式为白字黑边、底部对齐、每行≤42字符
适用人群内容创作者、社交媒体运营、影视后期人员、播客制作者、希伯来语-英语双语用户
不包含实时字幕、说话人分离、希伯来语/英语以外语种、可视化时间轴编辑器

 

风险提示

  • 首次运行需自动下载约3GB模型文件,请确保网络稳定与磁盘空间充足
  • 硬编码烧录后字幕不可关闭,建议保留原始文件备份
  • 翻译质量受源音频清晰度影响,专业场景建议人工校对
  • ffmpeg-full 为必需依赖,精简版可能缺少字幕渲染功能

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/ngutman/video-subtitles/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...