本地语音转文字

4小时前更新 1 00

Apple芯片离线语

收录时间：

2026-02-26

本地语音转文字

Parakeet MLX 是基于 Apple Silicon 芯片的本地语音识别工具，使用 MLX 框架运行 Parakeet 模型，将音频文件转换为文字，无需联网或 API 密钥。

安装步骤

确保已安装 uv 包管理器与 ffmpeg
执行安装指令：uv tool install parakeet-mlx -U（注意：使用 uv tool install 而非 uv add 或 pip install）
首次运行时自动从 Hugging Face 下载模型到 ~/.cache/huggingface

基础用法

见下方输入与输出表格。

项目	内容
输入	音频文件路径（支持 MP3、M4A、WAV 等格式）；输出格式参数；可选 –highlight-words、–verbose 等标志
输出	转录文本文件（txt）、字幕文件（srt/vtt）、JSON 格式（含时间戳与置信度分数）
适用人群	Apple Silicon Mac 用户；需要离线语音识别的开发者；处理敏感音频的隐私场景用户；播客与会议记录整理者
不包含	实时麦克风输入转录；Windows/Linux 平台支持；说话人分离功能；自定义模型训练能力

原始链接：https://github.com/openclaw/skills/tree/main/skills/kylehowells/parakeet-mlx/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论...