本地音频转文字

4天前更新 6 00

Docker运行Wh

收录时间：

2026-02-26

本地音频转文字

基于 faster-whisper 的本地音频转录工具，通过 Docker 容器运行，无需联网或 API 密钥即可将语音文件转换为纯文本。

进入技能目录并执行安装脚本：
```
cd /path/to/skills/transcribe/scripts
chmod +x install.sh
./install.sh
```
该命令会构建 whisper:local Docker 镜像，并安装 transcribe 命令行工具。
执行转录：
```
transcribe /path/to/audio.mp3 [language]
```
其中 language 参数可选：默认为 es（西班牙语），指定 en 为英语，auto 为自动检测。
如需更高准确度，可编辑 install.sh 将模型从 small 改为 large-v3。

见下方输入与输出表格。

项目	内容
输入	音频文件路径（支持 mp3、m4a、ogg、wav、webm、flac、aac）；可选语言参数（es/en/auto）
输出	纯文本字符串，直接输出至标准输出流
适用人群	需本地离线转录音频的开发者、处理客户语音消息的客服人员、注重数据隐私的金融从业者
不包含	实时麦克风输入转录、多人声分离、带时间轴的字幕文件生成、云端 API 调用版本

原始链接：https://github.com/openclaw/skills/tree/main/skills/javicasper/transcribe/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论...