音视频转写助手

22分钟前更新 1 00
音视频转写助手音视频转写助手
音视频转写助手

技能简介

本技能通过AssemblyAI API将音频或视频文件转换为文字,支持本地文件上传或公网URL,可导出字幕(SRT/VTT)、段落、句子等多种格式。

业务背景

快速将会议录音、培训视频、访谈素材转化为可用文字,释放人工听写成本。支持字幕直接输出,满足内容发布合规要求;结构化段落便于后续编辑归档,加速知识沉淀与传播效率。

落地案例:市场部上传产品发布会录像,自动生成带时间轴的字幕文件用于多平台分发;HR整理远程面试录音,按句子结构导出文本存档;法务团队批量处理合同谈判音频,获取可检索的段落化文档备查。

能做什么

  • 转写本地音频/视频文件或在线链接
  • 生成SRT、VTT字幕文件
  • 按段落或句子结构导出文本
  • 查询已有转写任务状态与结果
  • 传递高级参数如说话人分离、自动摘要

使用说明

安装要求

  1. Node.js 18+(需内置fetch)
  2. 环境变量 ASSEMBLYAI_API_KEY

配置步骤

~/.clawdbot/clawdbot.json 中添加:

{"skills":{"entries":{"assemblyai":{"enabled":true,"apiKey":"YOUR_ASSEMBLYAI_KEY","env":{"ASSEMBLYAI_API_KEY":"YOUR_ASSEMBLYAI_KEY"}}}}}

基础转写

node {baseDir}/assemblyai.mjs transcribe "./audio.mp3"
node {baseDir}/assemblyai.mjs transcribe "https://example.com/audio.mp3" --out ./result.txt

导出字幕

node {baseDir}/assemblyai.mjs transcribe "./video.mp4" --export srt --out ./sub.srt

从已有ID导出

node {baseDir}/assemblyai.mjs subtitles <transcript_id> vtt --out ./sub.vtt
node {baseDir}/assemblyai.mjs paragraphs <transcript_id> --out ./para.txt

输入与输出

见下方输入与输出表格。

项目内容
输入本地音频/视频文件路径、公网媒体URL、AssemblyAI API密钥、可选高级参数JSON
输出纯文本转写、SRT/VTT字幕、JSON完整数据、段落/句子结构化文本
适用人群会议记录整理者、视频字幕制作者、播客运营者、质性研究访谈分析人员
不包含实时流式转写、视频画面分析、自动翻译、离线识别能力

 

风险提示

  • API密钥需通过环境变量注入,避免写入日志或对话记录
  • 上传文件与转写请求须使用同一AssemblyAI项目的API密钥,否则返回403
  • 大文件建议加 --out 参数防止输出截断
  • 欧盟数据处理需手动设置 ASSEMBLYAI_BASE_URL 为EU节点

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/tristanmanchester/assemblyai-transcribe/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...