语音转文字服务

2小时前更新 4 00

低成本快速音频转录

收录时间：

2026-02-26

手机查看

语音转文字服务

技能简介

基于Speech is Cheap (SIC)的自动语音转文字服务，以极低价格提供快速准确的音频转录能力。

能做什么

将在线音频URL或本地文件转换为文字
支持100种语言的自动检测与指定识别
输出JSON、SRT、VTT等多种格式
启用说话人分离、词级时间戳、音频标签等高级功能
通过webhook接收任务完成通知

使用说明

安装步骤：

访问speechischeap.com注册账号获取API密钥（可使用优惠码CH5减免5美元）
将API密钥配置到环境变量：SIC_API_KEY=your_key_here
确保技能脚本路径可执行

基础用法：

# 转录在线音频
./skills/asr/scripts/asr.sh transcribe --url "https://example.com/audio.mp3"

# 转录本地文件
./skills/asr/scripts/asr.sh transcribe --file "./local-audio.wav"

# 查询任务状态
./skills/asr/scripts/asr.sh status "job-id-here"

输入与输出

见下方输入与输出表格。

项目	内容
输入	音频URL、本地文件；可选参数包括语言代码、输出格式、置信度阈值、webhook地址、隐私模式开关
输出	结构化JSON（默认），或SRT/VTT/WebVTT字幕格式；包含转录文本、时间戳、说话人信息、音频标签
适用人群	内容创作者、媒体制作团队、企业会议记录员、开发者构建自动化音频处理管道
不包含	视频画面分析、自定义模型训练、完全离线运行、实时连续流识别

风险提示

需妥善保管API密钥，避免泄露导致额度被盗用
本地文件上传涉及第三方服务器传输，敏感内容建议启用–private模式
免费额度用尽后会产生费用，需关注账户余额
网络不稳定可能导致大文件上传中断

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/ilyakam/asr/SKILL.md
来源类型：GitHub仓库

数据统计

暂无评论

暂无评论...

语音转文字服务

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

Deepdub语音合成

EachLabs语音转写

本地语音转文字

豆包语音合成

语音合成与识别

电话语音助手

本地语音转文字

Duby语音合成

暂无评论

标签云