FunASR 语音转文字

2天前发布 0 00

语音处理

收录时间:
2026-03-15
下载 Markdown 文档
保存原始技能说明,便于离线查看、转存和审查。
下载 Markdown 文档
FunASR 语音转文字FunASR 语音转文字
FunASR 语音转文字

FunASR 语音转文字

适用人群

适合:要做品牌配音、播客旁白或助手语音的人、要批量生成课程讲解、短视频配音或音频播报的人、要把固定音色接进客服、内容生产或语音产品流程的人。

技能介绍

使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件,支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。

本 skill 提供本地语音识别服务,将音频或视频文件转换为结构化的 Markdown 文档。

业务背景和落地案例

当团队需要语音处理时,可以先用FunASR 语音转文字完成第一轮处理。常见做法是把相关文件、网址、素材或配置交给它,先产出初版结果,再由人工确认和继续推进。

能做什么

  • 支持多种音视频格式(mp4、mov、mp3、wav、m4a、flac 等)。
  • 支持说话人分离(diarization)。
  • 输出 Markdown 格式,便于阅读和编辑。

安装方法

方式 1:对 OpenClaw 说(不用写代码)

适合:OpenClaw、Codex、Kimiclaw、Windsurf、Trae、华为 CodeArts。

直接对 OpenClaw 说:

帮我安装一个叫 FunASR 语音转文字 的 Skill。
如果安装时需要精确名字,就用 legal-skills-funasr-transcribe。
装好以后,先用它帮我处理一遍当前任务。

如果需要手动安装,可以用这条命令:

clawhub install legal-skills-funasr-transcribe

方式 2:导入 MD 安装

适合:腾讯Workbuddy、百度Duclaw、字节Arkclaw、智谱Autoclaw、科大讯飞Astronclaw。

  1. 找到这条 Skill 自带的 Markdown 文件,通常就是它的 SKILL.md 或同名 .md 文件。
  2. 把这个 Markdown 文件导入到你的产品里。
  3. 导入完成后,直接对 AI 说:
用刚刚导入的FunASR 语音转文字,先帮我处理当前任务。

备注:这一种本质上是导入一个 Markdown 文件,给知道安装包里有 .md 文件的人即可。

方式 3:代码安装

适合:Claude Code、Cursor、通义灵码、文心快码。

最短可用命令:

python scripts/setup.py

如果要继续执行,可以再用:

python scripts/server.py
python scripts/setup.py --verify

使用步骤

  1. 先选上面 3 种方式里,自己最容易完成的一种。
  2. 安装完成后,直接对 OpenClaw 说:“用FunASR 语音转文字帮我处理当前任务。” 先让它自己跑一遍就可以。
  3. 如果你已经有明确文件、网址、目录或数据,再把它补给 OpenClaw,让它只处理这一部分。
  4. 先看第一轮结果,再决定要不要追加条件、缩小范围或继续执行下一步。
  5. 如果这条 Skill 确实好用,就把它保留在常用列表,后面重复任务直接复用。

你需要准备什么

  • 与你当前任务相关的文件、网址、目录或数据。
  • 要处理的文本内容。
  • 语音样本、参考音色或角色要求。
  • 输出格式、语言或时长要求。
  • 如果这条 Skill 依赖外部服务,还要准备对应账号权限或可用凭证。

你会看到什么结果

  • 可直接使用的音频结果。
  • 语音角色配置或语音 ID。
  • 后续可继续复用的语音处理结果。

风险提示

  • 涉及 API Key、Token 或其他凭证时,先确认保存方式和权限边界。
  • 依赖外部服务时,网络波动、配额限制或接口变化都会影响结果。

来源信息

  • 公开页面地址: https://agentskillsrepo.com/skill/cat-xierluo/legal-skills-funasr-transcribe
  • SKILL.md 下载地址: https://agentskillsrepo.com/skill/cat-xierluo/legal-skills-funasr-transcribe/download

数据统计

相关导航

暂无评论

none
暂无评论...