语音转MIDI工具

4小时前更新 1 00

哼唱音频生成量化MI

收录时间:
2026-02-26
语音转MIDI工具语音转MIDI工具
语音转MIDI工具

技能简介

该技能将语音备忘录、哼唱或旋律录音转换为干净的量化MIDI文件,可直接导入数字音频工作站(DAW)使用。基于Spotify的Basic Pitch模型进行音高检测,结合智能后处理流程实现音频到MIDI的完整转换。

能做什么

  • 分离音频中的旋律成分与打击乐/噪音背景
  • 自动检测录音的调性并进行调性感知的音高校正
  • 将音符对齐到可配置的节拍网格(四分/八分/十六分/三十二分音符)
  • 合并连奏音符、修剪八度重叠、标准化力度值
  • 支持WAV/M4A/MP3输入,输出标准MIDI文件

使用说明

安装步骤:

方式一:快速安装(推荐)

cd /path/to/voice-note-to-midi
./setup.sh

该脚本会自动检查Python 3.11+环境,创建~/melody-pipeline目录,配置虚拟环境,安装basic-pitch/librosa/music21等依赖,并将工具加入PATH。

方式二:手动安装

mkdir -p ~/melody-pipeline
cd ~/melody-pipeline
python3 -m venv venv-bp
source venv-bp/bin/activate
pip install basic-pitch librosa soundfile mido music21
chmod +x ~/melody-pipeline/hum2midi
echo 'export PATH="$HOME/melody-pipeline:$PATH"' >> ~/.bashrc
source ~/.bashrc

基础用法:

./hum2midi my_humming.wav          # 默认十六分音符量化
./hum2midi input.wav output.mid    # 指定输出文件名
./hum2midi song.wav --key-aware    # 启用调性感知校正
./hum2midi melody.wav --grid 1/8   # 改为八分音符量化

输入与输出

见下方输入与输出表格。

项目内容
输入音频文件(WAV/M4A/MP3)或现有MIDI文件;命令行参数如–grid、–key-aware等
输出量化后的标准MIDI文件(.mid),可选十六分/八分等节拍精度
适用人群音乐制作人、作曲者、需要将即兴哼唱转为可编辑MIDI的用户、音频转谱需求者
不包含实时音频流处理、多轨混音功能、乐谱可视化输出、版权音乐识别

 

风险提示

  • 需要Python 3.11+运行环境,低版本可能无法正常使用
  • 复杂和弦或多声部音频的分离效果有限
  • 极端音域或跑调严重的录音检测准确率下降
  • 首次运行需下载ML模型,耗时约数分钟

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/danbennettuk/voice-note-to-midi/SKILL.md
来源类型:GitHub开源项目

数据统计

相关导航

暂无评论

none
暂无评论...