YouTube字幕获取

21分钟前更新 7 00
YouTube字幕获取YouTube字幕获取
YouTube字幕获取

技能简介

该技能通过APIFY API获取YouTube视频的字幕内容,解决云服务器IP被YouTube屏蔽的问题。APIFY使用住宅代理网络执行请求,可稳定绕过反爬虫机制。

业务背景

解决企业云服务器抓取YouTube字幕时IP被封的痛点。通过住宅代理网络稳定获取视频字幕,支持多语言与灵活格式输出,适用于内容分析、翻译制作、舆情监测等场景,无需自建复杂代理基础设施。

落地案例:市场部需批量分析竞品YouTube频道的内容策略。运营人员在AWS服务器部署该技能,输入目标视频链接即可提取中英文字幕,输出带时间戳的JSON供NLP工具分析关键词密度与话题趋势,规避了云IP被屏蔽导致的中断风险。

能做什么

  • 从YouTube视频链接提取完整字幕文本
  • 输出纯文本或带时间戳的JSON格式
  • 支持多语言字幕选择
  • 在云服务器环境(AWS、GCP等)正常运行

使用说明

1. 注册APIFY账号

访问 https://apify.com/ 创建免费账户,每月含$5额度(约714个视频)。

2. 获取API密钥

进入 https://console.apify.com/account/integrations 复制个人Token。

3. 配置环境变量

# 添加到 ~/.bashrc 或 ~/.zshrc
export APIFY_API_TOKEN="apify_api_YOUR_TOKEN_HERE"

# 或使用 .env 文件(勿提交到版本库)
echo 'APIFY_API_TOKEN=apify_api_YOUR_TOKEN_HERE' >> .env

4. 运行脚本

# 基础用法 - 获取纯文本字幕
python3 scripts/fetch_transcript.py "https://www.youtube.com/watch?v=VIDEO_ID"

# 输出到文件
python3 scripts/fetch_transcript.py "URL" --output transcript.txt

# JSON格式(含时间戳)
python3 scripts/fetch_transcript.py "URL" --json

# 指定语言
python3 scripts/fetch_transcript.py "URL" --lang de

输入与输出

见下方输入与输出表格。

项目内容
输入YouTube视频URL;APIFY_API_TOKEN环境变量;可选格式参数(–json/–output/–lang)
输出纯文本字幕,或JSON对象(含视频ID、标题、带时间戳的字幕片段、完整文本)
适用人群需要稳定获取YouTube字幕的开发者、研究人员、内容分析团队
不包含视频下载、自动翻译、批量处理封装、其他视频平台支持

 

风险提示

  • 需妥善保管APIFY_API_TOKEN,避免泄露
  • .env文件不应提交至代码仓库
  • 免费额度用尽后需付费,单价$0.007/视频
  • 部分视频可能无字幕或限制访问
  • API配额耗尽时将返回错误

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/inaor/some-other-youtube/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...