YouTube语音摘要

2分钟前更新 1 00
YouTube语音摘要YouTube语音摘要
YouTube语音摘要

技能简介

该技能将YouTube视频转换为专业播客风格的语音摘要,60秒内完成从视频到可收听音频的完整流程。

业务背景

帮助业务人员快速消化长视频内容,无需观看即可通过播客式音频掌握核心信息。适用于通勤、健身等碎片化场景,将视觉学习转为听觉学习,提升信息获取效率。支持多种声音风格匹配不同内容调性,满足营销简报、行业研报、培训素材等多场景需求。

落地案例:产品经理需分析用户评测视频,提取字幕后针对

能做什么

  • 提取YouTube视频字幕并生成AI摘要
  • 通过ElevenLabs将文本转为自然人声
  • 支持多种声音风格(播客、新闻、 casual、温暖女声)
  • 提供短/中/长三种摘要时长选择
  • 可选纯文本摘要模式(更快更省成本)

使用说明

前置安装(必需)

本技能依赖独立后端服务,需先部署:

git clone https://github.com/Franciscomoney/elevenlabs-moltbot.git
cd elevenlabs-moltbot
npm install
cp .env.example .env
# 配置API密钥后启动
npm start

需在.env中填入:ElevenLabs(语音合成)、Supadata(YouTube字幕)、OpenRouter(AI摘要)三项API密钥。

调用步骤

  1. 发送POST请求启动任务:
    curl -s -X POST http://127.0.0.1:3050/api/summarize \
      -H "Content-Type: application/json" \
      -d '{"url":"YOUTUBE_URL","length":"short","voice":"podcast"}'

    返回jobId用于追踪进度。

  2. 轮询任务状态(间隔3-5秒):
    curl -s http://127.0.0.1:3050/api/status/JOB_ID
  3. 完成后获取audioUrl发送给用户,同时可展示teaser文案和keyPoints要点。

输入与输出

见下方输入与输出表格。

项目内容
输入YouTube视频URL;摘要长度参数(short/medium/detailed);声音风格选项(podcast/news/casual/female_warm)
输出MP3音频文件URL;teaser引导文案;完整文本摘要;keyPoints要点列表;任务处理状态
适用人群播客听众、通勤用户、希望快速获取视频核心信息的效率型用户、内容创作者
不包含视频本地下载、实时直播流处理、多语言字幕分离、离线视频文件分析

 

风险提示

  • 视频必须开启字幕,新上传视频的自动生成字幕可能有延迟
  • BASE_URL需配置为公网可访问地址,防火墙需开放3050端口
  • 单次调用成本约0.06-0.17美元,含三家API费用
  • 音频URL有效期受存储策略影响,建议及时收听

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/franciscoandsam/youtube-voice-summarizer-elevenlabs/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...