Deepdub语音合成
生成语音并附加为媒体
基于Speech is Cheap (SIC)的自动语音转文字服务,以极低价格提供快速准确的音频转录能力。
安装步骤:
SIC_API_KEY=your_key_here基础用法:
# 转录在线音频
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3"
# 转录本地文件
./skills/asr/scripts/asr.sh transcribe --file "./local-audio.wav"
# 查询任务状态
./skills/asr/scripts/asr.sh status "job-id-here"
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 音频URL、本地文件;可选参数包括语言代码、输出格式、置信度阈值、webhook地址、隐私模式开关 |
| 输出 | 结构化JSON(默认),或SRT/VTT/WebVTT字幕格式;包含转录文本、时间戳、说话人信息、音频标签 |
| 适用人群 | 内容创作者、媒体制作团队、企业会议记录员、开发者构建自动化音频处理管道 |
| 不包含 | 视频画面分析、自定义模型训练、完全离线运行、实时连续流识别 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/ilyakam/asr/SKILL.md
来源类型:GitHub仓库