语音转MIDI工具

4小时前更新 1 00

哼唱音频生成量化MI

收录时间：

2026-02-26

手机查看

语音转MIDI工具

技能简介

该技能将语音备忘录、哼唱或旋律录音转换为干净的量化MIDI文件，可直接导入数字音频工作站(DAW)使用。基于Spotify的Basic Pitch模型进行音高检测，结合智能后处理流程实现音频到MIDI的完整转换。

能做什么

分离音频中的旋律成分与打击乐/噪音背景
自动检测录音的调性并进行调性感知的音高校正
将音符对齐到可配置的节拍网格（四分/八分/十六分/三十二分音符）
合并连奏音符、修剪八度重叠、标准化力度值
支持WAV/M4A/MP3输入，输出标准MIDI文件

使用说明

安装步骤：

方式一：快速安装（推荐）

cd /path/to/voice-note-to-midi
./setup.sh

该脚本会自动检查Python 3.11+环境，创建~/melody-pipeline目录，配置虚拟环境，安装basic-pitch/librosa/music21等依赖，并将工具加入PATH。

方式二：手动安装

mkdir -p ~/melody-pipeline
cd ~/melody-pipeline
python3 -m venv venv-bp
source venv-bp/bin/activate
pip install basic-pitch librosa soundfile mido music21
chmod +x ~/melody-pipeline/hum2midi
echo 'export PATH="$HOME/melody-pipeline:$PATH"' >> ~/.bashrc
source ~/.bashrc

基础用法：

./hum2midi my_humming.wav          # 默认十六分音符量化
./hum2midi input.wav output.mid    # 指定输出文件名
./hum2midi song.wav --key-aware    # 启用调性感知校正
./hum2midi melody.wav --grid 1/8   # 改为八分音符量化

输入与输出

见下方输入与输出表格。

项目	内容
输入	音频文件（WAV/M4A/MP3）或现有MIDI文件；命令行参数如–grid、–key-aware等
输出	量化后的标准MIDI文件（.mid），可选十六分/八分等节拍精度
适用人群	音乐制作人、作曲者、需要将即兴哼唱转为可编辑MIDI的用户、音频转谱需求者
不包含	实时音频流处理、多轨混音功能、乐谱可视化输出、版权音乐识别

风险提示

需要Python 3.11+运行环境，低版本可能无法正常使用
复杂和弦或多声部音频的分离效果有限
极端音域或跑调严重的录音检测准确率下降
首次运行需下载ML模型，耗时约数分钟

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/danbennettuk/voice-note-to-midi/SKILL.md
来源类型：GitHub开源项目

数据统计

暂无评论

暂无评论...

语音转MIDI工具

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

Loom视频流程分析

easyVerein API接入

资深数据科学家

语音合成服务

AI语音合成

W&B训练监控

本地语音合成

Voice.ai语音代理管理

暂无评论

标签云