贾维斯语音助手

21分钟前更新 1 00

离线AI语音人格化工

收录时间:
2026-02-26
贾维斯语音助手贾维斯语音助手
贾维斯语音助手

技能简介

Jarvis Voice 为 OpenClaw 代理赋予类似《钢铁侠》中 JARVIS 的语音人格:采用 sherpa-onnx 离线 TTS 引擎(英式 Alan 音色),配合 ffmpeg 金属音效处理,输出带有冷幽默风格的语音回复。

业务背景

为技术团队或极客用户打造沉浸式语音交互体验,无需联网即可生成带人格特色的语音反馈。金属音效与冷幽默风格强化产品辨识度,适合演示环境、开发者工具或个性化助手场景,降低对外部服务的依赖。

落地案例:某开源社区在Linux服务器管理工具中集成该功能。当管理员查询系统状态时,代理以英式口音播报

能做什么

  • 将文本转为带金属质感的离线语音播报
  • 在回复中自动渲染紫色斜体视觉转录
  • 运用四种喜剧模式生成个性化回应
  • 支持 Linux 系统后台异步播放

使用说明

安装依赖:

  1. 安装系统级工具:sudo apt install ffmpeg alsa-utils
  2. 确保 sherpa-onnx 运行时位于 ~/.openclaw/tools/sherpa-onnx-tts/
  3. 下载 Alan 中号模型至 ~/.openclaw/tools/sherpa-onnx-tts/models/vits-piper-en_GB-alan-medium/
  4. 将 jarvis 脚本放置于 ~/.local/bin/jarvis 并加入 PATH
  5. 设置环境变量:export SHERPA_ONNX_TTS_DIR=~/.openclaw/tools/sherpa-onnx-tts

调用方式:

exec(command='jarvis "Your spoken text here."', background=true)

随后在同一回复中添加视觉转录:**Jarvis:** *Your spoken text here.*

关键限制:禁用内置 tts 工具,必须使用 jarvis 命令;仅支持英文;单次回复限 1500 字符;每轮对话仅调用一次。

输入与输出

见下方输入与输出表格。

项目内容
输入英文文本字符串(≤1500字符);exec 命令参数 background=true
输出本地音频播放 + Markdown 格式紫色斜体转录行
适用人群Linux 桌面/服务器用户;需要离线语音的隐私敏感场景;偏好英式幽默风格的开发者
不包含云端语音合成;非英语语种;可视化语音波形或字幕同步;移动端支持

 

风险提示

  • 执行本地 shell 命令 jarvis 进行音频播放,需预先审查脚本内容
  • 固定参数设计,无网络调用、凭据传输或权限提升操作
  • 仅兼容 Linux 系统,依赖 ALSA 音频架构
  • Alan 模型无法处理非英语内容,需自行翻译

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/globalcaos/jarvis-voice/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...