Gong通话分析
销售通话检索与转录
该技能将WhatsApp语音消息转换为实时对话流程,提供完整的处理链路:语音接收→语音转文字→意图识别→生成回复→文字转语音发送。
1. 安装依赖
pip install openai-whisper soundfile numpy
2. 处理单条语音消息
const { processVoiceNote } = require('./scripts/voice-processor');
const fs = require('fs');
const buffer = fs.readFileSync('voice-message.ogg');
const result = await processVoiceNote(buffer);
console.log(result);
3. 启动自动监听服务
node scripts/voice-listener-daemon.js
该服务每5秒扫描 ~/.clawdbot/media/inbound/ 目录,自动处理新收到的语音文件。
4. 自定义意图(可选)
编辑 voice-processor.js,在 INTENTS 映射中添加关键词和处理器函数,即可扩展新的对话能力。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | WhatsApp语音消息文件(OGG/WAV/MP3等)、用户标识 |
| 输出 | 文字转录、意图识别结果、文字回复、TTS语音、状态信息 |
| 适用人群 | WhatsApp机器人开发者、多语言客服系统建设者、IoT语音控制开发者 |
| 不包含 | WhatsApp官方API配置、Whisper模型预下载、具体业务处理器、生产部署方案 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/syedateebulislam/whatsapp-voice-chat-integration-open-source/SKILL.md
来源类型:GitHub开源项目