Edge语音合成

3小时前更新 1 00
Edge语音合成Edge语音合成
Edge语音合成

技能简介

Edge-TTS 是基于 Microsoft Edge 神经语音服务的文本转语音转换工具,通过 node-edge-tts npm 包实现。支持多语言、多音色选择,可调节语速、音调和音量,并能生成同步字幕文件。

能做什么

  • 将任意文本转换为高质量 MP3 音频
  • 提供数十种语言和地区的自然语音选择
  • 调整播放速度(-50% 至 +100%)适应不同场景
  • 控制音调和音量,优化听觉体验
  • 导出 JSON 格式字幕文件,用于视频制作
  • 支持代理配置和超时设置,适配网络环境

使用说明

安装依赖

cd /home/user/clawd/skills/public/tts-skill/scripts
npm install

此命令安装 node-edge-tts 核心库和 commander 命令行解析工具。

基础用法(内置工具)

tts("需要转换为语音的文本")
// 返回: MEDIA: /path/to/audio.mp3

高级用法(脚本直接调用)

node tts-converter.js "文本内容" --voice zh-CN-XiaoxiaoNeural --rate +10% --output result.mp3

常用参数:–voice 指定音色,–rate 调整语速,–pitch 调整音调,–save-subtitles 保存字幕,–list-voices 查看全部可用音色。

配置管理

node config-manager.js --set-voice en-US-AriaNeural  # 设置默认音色
node config-manager.js --set-rate +10%               # 设置默认语速
node config-manager.js --get                         # 查看当前配置
node config-manager.js --reset                       # 恢复默认设置

配置持久化存储于 ~/.tts-config.json。

输入与输出

见下方输入与输出表格。

项目内容
输入待转换文本;可选参数包括音色名称、语速、音调、音量、输出格式、代理地址、超时时间
输出MP3 音频文件路径;可选 JSON 格式字幕文件
适用人群需要将文字转为语音收听的普通用户、视障人士、多任务场景使用者、视频创作者、语言学习者
不包含离线合成能力、实时流式输出、声音克隆、音频后期编辑功能

 

风险提示

  • 依赖 Microsoft Edge 在线 TTS 服务,需保持网络连接
  • 长文本转换可能触发接口限流或超时,建议分段处理
  • 部分音色在特定语言下效果有限,建议先试听再批量使用
  • 生成的音频文件需自行管理存储空间
  • 商业用途需注意微软语音服务的授权条款

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/i3130002/edge-tts/SKILL.md
来源类型:开源仓库

数据统计

相关导航

暂无评论

none
暂无评论...