贾维斯语音助手

21分钟前更新 1 00

离线AI语音人格化工

收录时间：

2026-02-26

手机查看

贾维斯语音助手

技能简介

Jarvis Voice 为 OpenClaw 代理赋予类似《钢铁侠》中 JARVIS 的语音人格：采用 sherpa-onnx 离线 TTS 引擎（英式 Alan 音色），配合 ffmpeg 金属音效处理，输出带有冷幽默风格的语音回复。

业务背景

为技术团队或极客用户打造沉浸式语音交互体验，无需联网即可生成带人格特色的语音反馈。金属音效与冷幽默风格强化产品辨识度，适合演示环境、开发者工具或个性化助手场景，降低对外部服务的依赖。

落地案例：某开源社区在Linux服务器管理工具中集成该功能。当管理员查询系统状态时，代理以英式口音播报

能做什么

将文本转为带金属质感的离线语音播报
在回复中自动渲染紫色斜体视觉转录
运用四种喜剧模式生成个性化回应
支持 Linux 系统后台异步播放

使用说明

安装依赖：

安装系统级工具：sudo apt install ffmpeg alsa-utils
确保 sherpa-onnx 运行时位于 ~/.openclaw/tools/sherpa-onnx-tts/
下载 Alan 中号模型至 ~/.openclaw/tools/sherpa-onnx-tts/models/vits-piper-en_GB-alan-medium/
将 jarvis 脚本放置于 ~/.local/bin/jarvis 并加入 PATH
设置环境变量：export SHERPA_ONNX_TTS_DIR=~/.openclaw/tools/sherpa-onnx-tts

调用方式：

exec(command='jarvis "Your spoken text here."', background=true)

随后在同一回复中添加视觉转录：**Jarvis:** *Your spoken text here.*

关键限制：禁用内置 tts 工具，必须使用 jarvis 命令；仅支持英文；单次回复限 1500 字符；每轮对话仅调用一次。

输入与输出

见下方输入与输出表格。

项目	内容
输入	英文文本字符串（≤1500字符）；exec 命令参数 background=true
输出	本地音频播放 + Markdown 格式紫色斜体转录行
适用人群	Linux 桌面/服务器用户；需要离线语音的隐私敏感场景；偏好英式幽默风格的开发者
不包含	云端语音合成；非英语语种；可视化语音波形或字幕同步；移动端支持

风险提示

执行本地 shell 命令 jarvis 进行音频播放，需预先审查脚本内容
固定参数设计，无网络调用、凭据传输或权限提升操作
仅兼容 Linux 系统，依赖 ALSA 音频架构
Alan 模型无法处理非英语内容，需自行翻译

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/globalcaos/jarvis-voice/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

贾维斯语音助手

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

本地语音转文字

语音唤醒播报

语音合成工作室

语音合成服务

地下城与龙虾

语音AI代理部署

Gong通话分析

Mac远程语音控制

暂无评论

标签云