Loom视频流程分析
将录屏转为可执行工作
该技能将语音备忘录、哼唱或旋律录音转换为干净的量化MIDI文件,可直接导入数字音频工作站(DAW)使用。基于Spotify的Basic Pitch模型进行音高检测,结合智能后处理流程实现音频到MIDI的完整转换。
安装步骤:
方式一:快速安装(推荐)
cd /path/to/voice-note-to-midi
./setup.sh
该脚本会自动检查Python 3.11+环境,创建~/melody-pipeline目录,配置虚拟环境,安装basic-pitch/librosa/music21等依赖,并将工具加入PATH。
方式二:手动安装
mkdir -p ~/melody-pipeline
cd ~/melody-pipeline
python3 -m venv venv-bp
source venv-bp/bin/activate
pip install basic-pitch librosa soundfile mido music21
chmod +x ~/melody-pipeline/hum2midi
echo 'export PATH="$HOME/melody-pipeline:$PATH"' >> ~/.bashrc
source ~/.bashrc
基础用法:
./hum2midi my_humming.wav # 默认十六分音符量化
./hum2midi input.wav output.mid # 指定输出文件名
./hum2midi song.wav --key-aware # 启用调性感知校正
./hum2midi melody.wav --grid 1/8 # 改为八分音符量化
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 音频文件(WAV/M4A/MP3)或现有MIDI文件;命令行参数如–grid、–key-aware等 |
| 输出 | 量化后的标准MIDI文件(.mid),可选十六分/八分等节拍精度 |
| 适用人群 | 音乐制作人、作曲者、需要将即兴哼唱转为可编辑MIDI的用户、音频转谱需求者 |
| 不包含 | 实时音频流处理、多轨混音功能、乐谱可视化输出、版权音乐识别 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/danbennettuk/voice-note-to-midi/SKILL.md
来源类型:GitHub开源项目