WhatsApp语音消息
文字转语音发送Wha
MoodCast 将任意文本转换为带有情绪表达的音频,并自动匹配环境音效。基于 ElevenLabs v3 音频标签和 Sound Effects API,分析内容后插入合适的情绪标记与背景声景。
内容创作者和营销团队可将静态文字转化为富有感染力的音频素材,无需专业配音人员即可批量生产带情绪张力的有声内容。通过自动匹配环境音效,显著降低播客、有声书及品牌音频内容的制作门槛与时间成本。
落地案例:某知识付费平台每日需将数十篇专栏文章转为音频推送。编辑输入文章文本,选择"calm"风格并添加"咖啡厅背景"环境音,系统自动生成带有温和语调和轻微咖啡杯碰撞声的晨读音频,直接用于APP推送,替代原有外包配音流程。
安装准备
需配置环境变量 ELEVENLABS_API_KEY(必需),可选配置默认声线、模型等参数。
基础用法
python3 {baseDir}/scripts/moodcast.py --text "要转换的文本"
添加环境音效
python3 {baseDir}/scripts/moodcast.py --text "文本" --ambient "咖啡店背景音"
保存文件
python3 {baseDir}/scripts/moodcast.py --text "文本" --output story.mp3
指定情绪风格
python3 {baseDir}/scripts/moodcast.py --text "文本" --mood dramatic
python3 {baseDir}/scripts/moodcast.py --text "文本" --mood calm
python3 {baseDir}/scripts/moodcast.py --text "文本" --mood excited
python3 {baseDir}/scripts/moodcast.py --text "文本" --mood scary
查看可用声线
python3 {baseDir}/scripts/moodcast.py --list-voices
自定义配置
python3 {baseDir}/scripts/moodcast.py --text "文本" --voice VOICE_ID --model eleven_v3 --output-format mp3_44100_128
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 纯文本内容;可选参数包括环境音效描述、情绪风格(dramatic/calm/excited/scary)、声线ID、输出路径、模型版本、输出格式 |
| 输出 | MP3格式音频文件;控制台显示带情绪标签的增强文本预览 |
| 适用人群 | 内容创作者、播客主播、开发者、教育工作者、需要将文字转为语音的个人用户 |
| 不包含 | 视频画面生成、实时语音克隆、离线运行、中文方言优化、超长文本一次性处理 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/ashutosh887/moodcast/SKILL.md
来源类型:GitHub 开源项目