Edge语音合成

3小时前更新 1 00

文本转语音生成工具

收录时间：

2026-02-26

手机查看

Edge语音合成

技能简介

Edge-TTS 是基于 Microsoft Edge 神经语音服务的文本转语音转换工具，通过 node-edge-tts npm 包实现。支持多语言、多音色选择，可调节语速、音调和音量，并能生成同步字幕文件。

能做什么

将任意文本转换为高质量 MP3 音频
提供数十种语言和地区的自然语音选择
调整播放速度（-50% 至 +100%）适应不同场景
控制音调和音量，优化听觉体验
导出 JSON 格式字幕文件，用于视频制作
支持代理配置和超时设置，适配网络环境

使用说明

安装依赖

cd /home/user/clawd/skills/public/tts-skill/scripts
npm install

此命令安装 node-edge-tts 核心库和 commander 命令行解析工具。

基础用法（内置工具）

tts("需要转换为语音的文本")
// 返回: MEDIA: /path/to/audio.mp3

高级用法（脚本直接调用）

node tts-converter.js "文本内容" --voice zh-CN-XiaoxiaoNeural --rate +10% --output result.mp3

常用参数：–voice 指定音色，–rate 调整语速，–pitch 调整音调，–save-subtitles 保存字幕，–list-voices 查看全部可用音色。

配置管理

node config-manager.js --set-voice en-US-AriaNeural  # 设置默认音色
node config-manager.js --set-rate +10%               # 设置默认语速
node config-manager.js --get                         # 查看当前配置
node config-manager.js --reset                       # 恢复默认设置

配置持久化存储于 ~/.tts-config.json。

输入与输出

见下方输入与输出表格。

项目	内容
输入	待转换文本；可选参数包括音色名称、语速、音调、音量、输出格式、代理地址、超时时间
输出	MP3 音频文件路径；可选 JSON 格式字幕文件
适用人群	需要将文字转为语音收听的普通用户、视障人士、多任务场景使用者、视频创作者、语言学习者
不包含	离线合成能力、实时流式输出、声音克隆、音频后期编辑功能

风险提示

依赖 Microsoft Edge 在线 TTS 服务，需保持网络连接
长文本转换可能触发接口限流或超时，建议分段处理
部分音色在特定语言下效果有限，建议先试听再批量使用
生成的音频文件需自行管理存储空间
商业用途需注意微软语音服务的授权条款

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/i3130002/edge-tts/SKILL.md
来源类型：开源仓库

数据统计

暂无评论

暂无评论...

Edge语音合成

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

YouTube视频助手

AI音频内容生成

音视频转录工具

电话语音助手

Discord语音助手

本地语音合成

ElevenLabs语音合成

Voice.ai语音代理管理

暂无评论

标签云