业余无线电DX监控
追踪稀有电台信号
MinerU PDF 是一个在本地 CPU 环境下运行的 PDF 解析工具,可将 PDF 文档转换为 Markdown 或 JSON 格式,支持表格与图片内容的提取。
安装准备
本技能依赖 MinerU 工具链,需确保系统已安装 Python 3.8+ 及相应依赖库。具体安装步骤请参照原始仓库文档完成环境配置。
执行解析
./scripts/mineru_parse.sh /path/to/file.pdf./mineru-output/<文件名>/)可选参数
--format json:指定输出格式为 JSON--tables:启用表格提取--images:启用图片提取见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 本地 PDF 文件路径;可选参数:–format、–tables、–images |
| 输出 | Markdown 文件、JSON 数据、表格文件、图片文件(均保存至 ./mineru-output/ 下子目录) |
| 适用人群 | 需在本地离线环境处理 PDF 的开发者、金融数据分析人员、有数据安全合规要求的团队 |
| 不包含 | GPU 加速、云端服务、自动批量目录解析功能 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/kesslerio/mineru-pdf-parser-clawdbot-skill/SKILL.md
来源类型:GitHub 开源仓库