动画代码指南
Manim动画制作规范参考
Screen Narrator 是一款 macOS 屏幕活动实时解说工具,结合 Gemini 视觉模型与 ElevenLabs语音合成,将屏幕画面转化为七种风格的连续语音旁白。
安装步骤
cd /Users/buddy/narratorpython3 -m venv .venvsource .venv/bin/activatepip install -r requirements.txtGEMINI_API_KEY 和 ELEVENLABS_API_KEY(可选 ELEVENLABS_VOICE_ID)启动解说
在 tmux 后台会话中启动(推荐方式):
tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator sports --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"
限时运行示例(5分钟):
tmux new-session -d -s narrator "cd /Users/buddy/narrator && /Users/buddy/narrator/.venv/bin/python -m narrator wrestling --time 5m --control-file /tmp/narrator-ctl.json --status-file /tmp/narrator-status.json"
实时控制
切换风格:echo '{"command": "style", "value": "horror"}' > /tmp/narrator-ctl.json
调节用语强度:echo '{"command": "profanity", "value": "low"}' > /tmp/narrator-ctl.json
暂停/恢复:echo '{"command": "pause"}' > /tmp/narrator-ctl.json / echo '{"command": "resume"}' > /tmp/narrator-ctl.json
停止会话:tmux kill-session -t narrator
查看状态:cat /tmp/narrator-status.json
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | macOS屏幕实时画面流;控制指令JSON文件;Gemini API密钥;ElevenLabs API密钥 |
| 输出 | 实时语音解说音频流;状态反馈JSON文件;tmux会话日志 |
| 适用人群 | 直播主播、内容创作者、无障碍开发者、需要屏幕监控语音反馈的用户 |
| 不包含 | Windows/Linux支持、离线视频处理、多语言自动切换、API密钥提供 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/buddyh/narrator/SKILL.md
来源类型:GitHub 仓库