本地语音转文字
Apple芯片离线语
这个skill将文字转成语音,完全在本地运行,不需要调用云端API,也不需要API密钥。使用Piper语音模型和sherpa-onnx引擎,支持德语和英语,输出Telegram语音消息格式。
安装步骤:
1. 安装sherpa-onnx运行时:
sudo mkdir -p /opt/sherpa-onnx
cd /opt/sherpa-onnx
curl -L -o sherpa.tar.bz2 "https://github.com/k2-fsa/sherpa-onnx/releases/download/v1.12.23/sherpa-onnx-v1.12.23-linux-x64-shared.tar.bz2"
sudo tar -xjf sherpa.tar.bz2 --strip-components=1
rm sherpa.tar.bz2
2. 下载语音模型:
sudo mkdir -p /opt/piper-voices
cd /opt/piper-voices
# 德语语音
curl -L -o thorsten.tar.bz2 "https://github.com/k2-fsa/sherpa-onnx/releases/download/tts-models/vits-piper-de_DE-thorsten-medium.tar.bz2"
sudo tar -xjf thorsten.tar.bz2 && rm thorsten.tar.bz2
# 英语语音
curl -L -o ryan.tar.bz2 "https://github.com/k2-fsa/sherpa-onnx/releases/download/tts-models/vits-piper-en_US-ryan-high.tar.bz2"
sudo tar -xjf ryan.tar.bz2 && rm ryan.tar.bz2
3. 安装ffmpeg:
sudo apt install -y ffmpeg
4. 设置环境变量:
export SHERPA_ONNX_DIR="/opt/sherpa-onnx"
export PIPER_VOICES_DIR="/opt/piper-voices"
使用方法:
{baseDir}/bin/voice-reply "要朗读的文字" [语言代码]
参数说明:
text:要转成语音的文字(必需)language:语言代码,de表示德语,en表示英语(可选,默认自动检测)示例:
# 德语
{baseDir}/bin/voice-reply "Hallo, ich bin dein Assistent!" de
# 英语
{baseDir}/bin/voice-reply "Hello, I am your assistant!" en
# 自动检测
{baseDir}/bin/voice-reply "Guten Tag, wie geht es dir?"
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | text(要转成语音的文字) language(语言代码:de/en,可选) |
| 输出 | OGG格式语音文件、[[audio_as_voice]]标签、MEDIA:文件路径 |
| 适用人群 | 需要语音回复功能、注重隐私、在无网络环境使用的用户 |
| 不包含 | 中文语音支持、Windows/macOS系统支持、实时语音流输出 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/stolot0mt0m/voice-reply/SKILL.md
来源类型:github