音视频转写助手

22分钟前更新 1 00

AssemblyAI

收录时间：

2026-02-26

手机查看

音视频转写助手

技能简介

本技能通过AssemblyAI API将音频或视频文件转换为文字，支持本地文件上传或公网URL，可导出字幕（SRT/VTT）、段落、句子等多种格式。

业务背景

快速将会议录音、培训视频、访谈素材转化为可用文字，释放人工听写成本。支持字幕直接输出，满足内容发布合规要求；结构化段落便于后续编辑归档，加速知识沉淀与传播效率。

落地案例：市场部上传产品发布会录像，自动生成带时间轴的字幕文件用于多平台分发；HR整理远程面试录音，按句子结构导出文本存档；法务团队批量处理合同谈判音频，获取可检索的段落化文档备查。

能做什么

转写本地音频/视频文件或在线链接
生成SRT、VTT字幕文件
按段落或句子结构导出文本
查询已有转写任务状态与结果
传递高级参数如说话人分离、自动摘要

使用说明

安装要求

Node.js 18+（需内置fetch）
环境变量 ASSEMBLYAI_API_KEY

配置步骤

在 ~/.clawdbot/clawdbot.json 中添加：

{"skills":{"entries":{"assemblyai":{"enabled":true,"apiKey":"YOUR_ASSEMBLYAI_KEY","env":{"ASSEMBLYAI_API_KEY":"YOUR_ASSEMBLYAI_KEY"}}}}}

基础转写

node {baseDir}/assemblyai.mjs transcribe "./audio.mp3"
node {baseDir}/assemblyai.mjs transcribe "https://example.com/audio.mp3" --out ./result.txt

导出字幕

node {baseDir}/assemblyai.mjs transcribe "./video.mp4" --export srt --out ./sub.srt

从已有ID导出

node {baseDir}/assemblyai.mjs subtitles <transcript_id> vtt --out ./sub.vtt
node {baseDir}/assemblyai.mjs paragraphs <transcript_id> --out ./para.txt

输入与输出

见下方输入与输出表格。

项目	内容
输入	本地音频/视频文件路径、公网媒体URL、AssemblyAI API密钥、可选高级参数JSON
输出	纯文本转写、SRT/VTT字幕、JSON完整数据、段落/句子结构化文本
适用人群	会议记录整理者、视频字幕制作者、播客运营者、质性研究访谈分析人员
不包含	实时流式转写、视频画面分析、自动翻译、离线识别能力

风险提示

API密钥需通过环境变量注入，避免写入日志或对话记录
上传文件与转写请求须使用同一AssemblyAI项目的API密钥，否则返回403
大文件建议加 --out 参数防止输出截断
欧盟数据处理需手动设置 ASSEMBLYAI_BASE_URL 为EU节点

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/tristanmanchester/assemblyai-transcribe/SKILL.md
来源类型：GitHub仓库

数据统计

暂无评论

暂无评论...

音视频转写助手

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

多语言语音合成

Molta智能体问答

Voice.ai语音代理管理

Nimble实时搜索

共享推理层

学中文引擎

PikaBoard任务看板

数字商品上架

暂无评论

标签云