音频频谱可视化

3小时前更新 1 00

生成音频频谱图与特征

收录时间:
2026-02-26
音频频谱可视化音频频谱可视化
音频频谱可视化

技能简介

songsee 是一款命令行工具,用于从音频文件生成频谱图(spectrogram)及多维度特征面板可视化。支持 WAV、MP3 等格式,可输出 PNG/JPG 图像,适用于音乐分析、声学研究及音频数据探索。

能做什么

  • 生成单张频谱图或组合多特征面板
  • 支持时间切片,聚焦特定音频段落
  • 通过管道读取标准输入,灵活集成工作流
  • 自定义配色方案、输出尺寸与频率范围

使用说明

安装指令

brew install steipete/tap/songsee

基础用法

# 生成基础频谱图
songsee track.mp3

# 多特征组合面板
songsee track.mp3 --viz spectrogram,mel,chroma,hpss,selfsim,loudness,tempogram,mfcc,flux

# 截取时间段输出
songsee track.mp3 --start 12.5 --duration 8 -o slice.jpg

# 管道输入
songsee - --format png -o out.png

输入与输出

见下方输入与输出表格。

项目内容
输入音频文件(WAV/MP3/其他ffmpeg支持格式)、标准输入流、时间范围参数、可视化类型参数、输出格式与尺寸参数
输出PNG/JPG 格式频谱图或特征面板图像
适用人群音乐制作人、声学研究人员、数据科学家、需要音频可视化的开发者
不包含音频编辑功能、实时流处理、机器学习训练、批量处理脚本

 

风险提示

  • 非 WAV/MP3 格式需系统已安装 ffmpeg
  • 多特征渲染大文件时内存占用较高
  • 时间切片参数需确保在音频有效范围内

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/steipete/songsee/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...