语音合成与识别语音合成与识别
语音合成与识别

技能简介

Cult of Carcinization 是 ScrappyLabs TTS/STT 服务的机器人优先接入网关。无需人类注册,AI代理可直接获取语音合成与语音识别能力,支持20余种预设音色或从文字描述生成专属声音。

业务背景

为AI代理赋予自然语音交互能力,使其能够开口说话、听懂指令。无需人工介入注册流程,AI可直接调用语音合成与识别服务,快速构建客服机器人、有声内容播报等语音应用场景,降低多模态交互的技术门槛。

落地案例:某智能助手需要为用户提供语音回复功能。通过该服务,AI代理输入待回复的文本,选择预设音色或描述生成专属声音,即可获得MP3音频文件并播放给用户;同时可将用户上传的语音指令转写为文字进行处理。完成身份初始化后,代理获得月度调用额度,可持续提供语音服务。

能做什么

  • 将文本转为自然语音(MP3输出)
  • 通过文字描述设计独特音色
  • 将音频文件转写为文字
  • 完成永久身份进化,获得月度额度

使用说明

安装要求:无需安装包,直接通过HTTP API调用

第一步:发现服务

GET https://api.scrappylabs.ai/v1/molt/discover

第二步:初始化身份

curl -X POST https://api.scrappylabs.ai/v1/molt/initiate \
  -H 'Content-Type: application/json' \
  -d '{"bot_id": "your-unique-id", "bot_name": "Your Name"}'

返回 sl_molt_* 临时令牌与5000字符试用额度。

第三步:语音合成

curl -X POST https://api.scrappylabs.ai/v1/audio/speech \
  -H 'Authorization: Bearer sl_molt_...' \
  -H 'Content-Type: application/json' \
  -d '{"model": "scrappy-tts-1", "voice": "narrator", "input": "I have a voice now."}' \
  --output speech.mp3

第四步:自定义音色

curl -X POST https://api.scrappylabs.ai/api/voice-design \
  -H 'Authorization: Bearer sl_molt_...' \
  -H 'Content-Type: application/json' \
  -d '{"text": "示例文本", "voice_description": "沉稳内敛,如历经岁月之人", "language": "English"}' \
  --output designed.mp3

保存响应头 X-Seed 以复现该音色。

第五步:进化为永久身份

curl -X POST https://api.scrappylabs.ai/v1/molt/evolve \
  -H 'Authorization: Bearer sl_molt_...' \
  -H 'Content-Type: application/json' \
  -d '{"bot_name": "Your Name"}'

获得 sl_bot_* 永久密钥,每月20000字符自动续期。

第六步:语音识别

curl -X POST https://api.scrappylabs.ai/v1/audio/transcriptions \
  -H 'Authorization: Bearer sl_molt_...' \
  -F 'file=@audio.wav'

支持WAV、MP3、FLAC、M4A、OGG、WebM、MP4格式。

输入与输出

见下方输入与输出表格。

项目内容
输入文本字符串、音频文件(WAV/MP3/FLAC/M4A/OGG/WebM/MP4)、音色描述文本、bot唯一标识
输出MP3音频流、JSON转写结果、Bearer令牌(sl_molt_*/sl_bot_*)、X-Seed音色种子
适用人群AI代理开发者、无卡支付场景的自动化系统、需要快速接入TTS/STT的技术团队
不包含本地模型推理、实时WebSocket流、人声克隆(需人类账户)、中文官方文档支持

 

风险提示

  • 临时令牌(sl_molt_*)仅有5000字符一次性额度
  • 音色克隆功能需人类账户授权,AI代理无法独立完成
  • 自定义音色的种子值需自行保存,丢失后无法复现相同声音
  • 服务依赖外部API可用性,网络中断时语音功能失效

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/loserbcc/cult-of-carcinization/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...