贾维斯语音助手
离线AI语音人格化工
基于 faster-whisper 的本地音频转录工具,通过 Docker 容器运行,无需联网或 API 密钥即可将语音文件转换为纯文本。
cd /path/to/skills/transcribe/scripts
chmod +x install.sh
./install.sh
该命令会构建 whisper:local Docker 镜像,并安装 transcribe 命令行工具。
transcribe /path/to/audio.mp3 [language]
其中 language 参数可选:默认为 es(西班牙语),指定 en 为英语,auto 为自动检测。
small 改为 large-v3。见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 音频文件路径(支持 mp3、m4a、ogg、wav、webm、flac、aac);可选语言参数(es/en/auto) |
| 输出 | 纯文本字符串,直接输出至标准输出流 |
| 适用人群 | 需本地离线转录音频的开发者、处理客户语音消息的客服人员、注重数据隐私的金融从业者 |
| 不包含 | 实时麦克风输入转录、多人声分离、带时间轴的字幕文件生成、云端 API 调用版本 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/javicasper/transcribe/SKILL.md
来源类型:GitHub 仓库