MLX Swift语言模型
Apple芯片本地运
Parakeet MLX 是基于 Apple Silicon 芯片的本地语音识别工具,使用 MLX 框架运行 Parakeet 模型,将音频文件转换为文字,无需联网或 API 密钥。
安装步骤
uv 包管理器与 ffmpeguv tool install parakeet-mlx -U(注意:使用 uv tool install 而非 uv add 或 pip install)~/.cache/huggingface基础用法
parakeet-mlx /path/audio.mp3 --output-format txtparakeet-mlx /path/audio.m4a --output-format vtt --highlight-wordsparakeet-mlx *.mp3 --output-format allparakeet-mlx --help见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 音频文件路径(支持 MP3、M4A、WAV 等格式);输出格式参数;可选 –highlight-words、–verbose 等标志 |
| 输出 | 转录文本文件(txt)、字幕文件(srt/vtt)、JSON 格式(含时间戳与置信度分数) |
| 适用人群 | Apple Silicon Mac 用户;需要离线语音识别的开发者;处理敏感音频的隐私场景用户;播客与会议记录整理者 |
| 不包含 | 实时麦克风输入转录;Windows/Linux 平台支持;说话人分离功能;自定义模型训练能力 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/kylehowells/parakeet-mlx/SKILL.md
来源类型:GitHub 仓库