GETTR音视频转写摘要

4小时前更新 1 00
GETTR音视频转写摘要GETTR音视频转写摘要
GETTR音视频转写摘要

技能简介

该技能从GETTR帖子提取音频,使用Apple Silicon芯片上的MLX Whisper进行本地语音转写,生成带时间戳的VTT字幕文件,并将转写内容整理为要点列表或分段大纲。

能做什么

  • 解析GETTR帖子URL,提取视频/音频流地址
  • 下载音频并转换为16kHz单声道WAV格式
  • 本地执行语音转写,输出带时间戳的VTT文件
  • 将转写结果汇总为结构化摘要(要点或分段大纲)
  • 支持多语言内容,可手动指定语言代码优化识别质量

使用说明

安装依赖

# 安装 mlx-whisper
pip install mlx-whisper

# 安装 ffmpeg(推荐通过 Homebrew)
brew install ffmpeg

基础流程

  1. 从GETTR URL解析slug(如 https://gettr.com/post/p1abc2defp1abc2def
  2. 获取视频URL:
    • /post/ 链接:运行 python3 scripts/extract_gettr_og_video.py "<URL>"
    • /streaming/ 链接:需通过浏览器自动化获取动态签名URL
  3. 执行转写管道:bash scripts/run_pipeline.sh "<VIDEO_URL>" "<SLUG>"
  4. 如需指定语言:bash scripts/run_pipeline.sh --language zh "<VIDEO_URL>" "<SLUG>"

输出文件位于 ./out/gettr-transcribe-summarize/<slug>/,包含 audio.wav、audio.vtt 及后续生成的 summary.md。

输入与输出

见下方输入与输出表格。

项目内容
输入GETTR帖子URL;输出格式偏好;摘要长度;语言代码(可选)
输出WAV音频文件、VTT字幕文件、Markdown摘要文档
适用人群Apple Silicon Mac用户、金融舆情分析人员、本地隐私优先用户
不包含私密登录内容、自动翻译、非Apple芯片加速、实时直播

 

风险提示

  • 不支持需要登录验证的私密GETTR帖子
  • /streaming/ 链接的静态HTML提取不可靠,必须使用浏览器自动化获取动态URL
  • 签名URL可能过期,遇到HTTP 412错误需重新获取
  • 不执行翻译,输出保持原视频语言
  • 自动语言检测失败时需手动指定语言代码

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/kevin37li/gettr-transcribe-summarize/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...