语音转文字服务

2小时前更新 4 00
语音转文字服务语音转文字服务
语音转文字服务

技能简介

基于Speech is Cheap (SIC)的自动语音转文字服务,以极低价格提供快速准确的音频转录能力。

能做什么

  • 将在线音频URL或本地文件转换为文字
  • 支持100种语言的自动检测与指定识别
  • 输出JSON、SRT、VTT等多种格式
  • 启用说话人分离、词级时间戳、音频标签等高级功能
  • 通过webhook接收任务完成通知

使用说明

安装步骤:

  1. 访问speechischeap.com注册账号获取API密钥(可使用优惠码CH5减免5美元)
  2. 将API密钥配置到环境变量:SIC_API_KEY=your_key_here
  3. 确保技能脚本路径可执行

基础用法:

# 转录在线音频
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3"

# 转录本地文件
./skills/asr/scripts/asr.sh transcribe --file "./local-audio.wav"

# 查询任务状态
./skills/asr/scripts/asr.sh status "job-id-here"

输入与输出

见下方输入与输出表格。

项目内容
输入音频URL、本地文件;可选参数包括语言代码、输出格式、置信度阈值、webhook地址、隐私模式开关
输出结构化JSON(默认),或SRT/VTT/WebVTT字幕格式;包含转录文本、时间戳、说话人信息、音频标签
适用人群内容创作者、媒体制作团队、企业会议记录员、开发者构建自动化音频处理管道
不包含视频画面分析、自定义模型训练、完全离线运行、实时连续流识别

 

风险提示

  • 需妥善保管API密钥,避免泄露导致额度被盗用
  • 本地文件上传涉及第三方服务器传输,敏感内容建议启用–private模式
  • 免费额度用尽后会产生费用,需关注账户余额
  • 网络不稳定可能导致大文件上传中断

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/ilyakam/asr/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...