YouTube字幕提取

4小时前更新 1 00
YouTube字幕提取YouTube字幕提取
YouTube字幕提取

技能简介

YouTube Transcript 用于获取 YouTube 视频的字幕文本,并可选择对内容进行总结。该技能通过住宅 IP 代理绕过 YouTube 对云服务器 IP 的封锁限制。

能做什么

  • 根据视频 ID 或完整 URL 提取字幕
  • 自动检测并连接 VPN 以解决云服务器访问限制
  • 支持多语言字幕优先级设置
  • 输出包含时间戳的完整字幕数组和纯文本内容
  • 为后续内容分析和摘要提供结构化数据

使用说明

  1. 安装依赖:参考 references/SETUP.md 安装 Python 依赖包,配置 WireGuard VPN(云服务器必需)
  2. 运行脚本
    python3 scripts/fetch_transcript.py <video_id_or_url> [languages]
  3. 示例命令
    python3 scripts/fetch_transcript.py dQw4w9WgXcQ
    python3 scripts/fetch_transcript.py "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
    python3 scripts/fetch_transcript.py dQw4w9WgXcQ "fr,en,de"
  4. 获取结果:脚本返回 JSON 格式数据,包含 video_id、title、author、full_text 及带时间戳的 transcript 数组

输入与输出

见下方输入与输出表格。

项目内容
输入YouTube 视频 ID 或完整 URL;可选语言代码参数
输出JSON 格式:视频元数据 + 完整字幕文本 + 时间戳分段数组
适用人群金融分析师、内容研究员、视频资料整理人员
不包含视频画面分析、AI 语音转录、内置自动摘要功能

 

风险提示

  • 需要配置 VPN 或代理才能从云服务器正常访问 YouTube
  • 部分视频可能无字幕或限制字幕下载
  • 多语言参数需使用正确的 ISO 语言代码
  • 频繁请求可能触发 YouTube 的反爬机制

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/xthezealot/youtube-transcript/SKILL.md
来源类型:GitHub 开源项目

数据统计

相关导航

暂无评论

none
暂无评论...