Visla视频生成
AI自动生成视频工具
songsee 是一款命令行工具,用于从音频文件生成频谱图(spectrogram)及多维度特征面板可视化。支持 WAV、MP3 等格式,可输出 PNG/JPG 图像,适用于音乐分析、声学研究及音频数据探索。
安装指令
brew install steipete/tap/songsee
基础用法
# 生成基础频谱图
songsee track.mp3
# 多特征组合面板
songsee track.mp3 --viz spectrogram,mel,chroma,hpss,selfsim,loudness,tempogram,mfcc,flux
# 截取时间段输出
songsee track.mp3 --start 12.5 --duration 8 -o slice.jpg
# 管道输入
songsee - --format png -o out.png
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 音频文件(WAV/MP3/其他ffmpeg支持格式)、标准输入流、时间范围参数、可视化类型参数、输出格式与尺寸参数 |
| 输出 | PNG/JPG 格式频谱图或特征面板图像 |
| 适用人群 | 音乐制作人、声学研究人员、数据科学家、需要音频可视化的开发者 |
| 不包含 | 音频编辑功能、实时流处理、机器学习训练、批量处理脚本 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/steipete/songsee/SKILL.md
来源类型:GitHub 仓库