WhatsApp语音对讲
WhatsApp语音
该技能提供基于AI的高质量语音合成功能,支持9种不同风格的角色音色与11种语言输出,可将文本内容转换为自然流畅的语音。
该技能满足企业全球化内容分发与多场景语音交互需求。通过9种差异化角色音色,业务可匹配品牌调性选择专业播报或亲和客服风格;11种语言覆盖助力跨境服务本地化。适用于金融实时行情推送、APP通知提醒、智能外呼等高频触客场景,降低人工录音成本,实现内容规模化音频化生产。
落地案例:某证券公司每日需向客户推送收盘行情摘要。运营人员调用该技能,配置
安装指令
# 原始文档未提供具体安装命令
# 通常需通过包管理器或容器部署
# 建议查阅来源仓库获取最新安装方式
基本调用
配置目标音色与语言参数后,传入待转换文本即可获取音频输出。具体API格式需参考来源仓库示例。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 待合成文本字符串;音色选择参数(9种预设角色);语言代码(11种语言);可选语速控制 |
| 输出 | 合成后的音频数据流;包含时长信息的元数据 |
| 适用人群 | 金融数据播报开发者、多语言内容运营者、智能客服集成商、无障碍产品设计师 |
| 不包含 | 实时声纹克隆功能;用户自定义音色训练;细粒度情感标记控制;企业级SLA保障 |
来源链接:https://github.com/openclaw/skills/tree/main/skills/gizmogremlin/voice-ai-tts/SKILL.md
来源类型:GitHub仓库
原始链接暂时无法打开(系统于 2026-02-25 检查)。