多语言语音合成
九角色十一语种高质量
该技能通过TranscriptAPI.com服务,从YouTube视频中提取隐藏式字幕(CC)和多语言字幕,支持带时间戳的结构化输出或纯文本格式。
帮助市场、培训及内容团队快速获取YouTube视频的文字内容,无需手动转录即可进行多语言素材整理、竞品分析脚本提取、内部培训课程字幕归档。支持结构化时间戳定位关键片段,大幅提升视频内容二次加工效率。
落地案例:某企业培训部门需将行业大咖的英文演讲视频转化为内部学习资料。通过该技能输入视频URL,选择中文或英文字幕版本,一键导出带时间戳的文本,直接导入课件制作工具;若仅需文字稿用于知识库沉淀,可切换纯文本格式,省去人工听写与校对环节。
安装与配置
首次使用需完成API密钥注册:
node ./scripts/tapi-auth.js register --email 用户邮箱node ./scripts/tapi-auth.js verify --token 上一步返回的令牌 --otp 验证码密钥自动保存至~/.openclaw/openclaw.json,原文件会被备份为.bak。也可手动访问transcriptapi.com/signup注册。
调用方式
curl -s "https://transcriptapi.com/api/v2/youtube/transcript?video_url=视频URL&format=json&include_timestamp=true" \
-H "Authorization: Bearer $TRANSCRIPT_API_KEY"
关键参数:video_url(必填,支持完整URL或视频ID)、format(json/text)、include_timestamp(true/false)。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | YouTube视频URL或视频ID;可选参数:语言代码、输出格式(json/text)、时间戳开关 |
| 输出 | 结构化字幕数据(含text/start/duration字段)或纯文本带时间戳字符串;视频元数据对象 |
| 适用人群 | 听障用户、内容审核人员、翻译工作者、学术研究者、需获取视频文字稿的用户 |
| 不包含 | 音视频下载、实时直播字幕、非YouTube平台支持、字幕编辑功能、批量处理能力 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/therohitdas/captions/SKILL.md
来源类型:开源技能仓库