文档文字提取

2小时前更新 6 00

从图片和PDF提取文

收录时间：

2026-02-26

PDF与文档处理 # API调用 # OCR识别 # PDF解析 # 票据处理

文档文字提取

文档文字提取

技能简介

LLMWhisperer 是一个基于 API 的文档解析工具，可从图片和 PDF 文件中提取文字内容并保留原始版式结构，对手写体和复杂表格有较好支持。

能做什么

从扫描件、照片中提取可编辑文字
解析 PDF 发票、合同、报表等金融单据
保留段落、表格等原始排版信息
处理手写笔记和签名区域

使用说明

获取 API Key：访问 unstract.com/llmwhisperer 注册免费账户（每日 100 页额度）

配置环境变量：

echo "LLMWHISPERER_API_KEY=your_key_here" >> ~/.clawdbot/.env

执行提取命令：
```
llmwhisperer <文件路径>
```
保存结果到文件：
```
llmwhisperer invoice.pdf > output.txt
```

输入与输出

见下方输入与输出表格。

项目	内容
输入	本地图片文件（JPG/PNG）或 PDF 文档；需配置 LLMWHISPERER_API_KEY
输出	JSON 格式文本，包含提取的文字内容及版式保留标记
适用人群	金融单据处理人员、档案数字化工作者、需要解析手写材料的用户
不包含	离线识别能力、自动分类归档、直接生成 Excel 等结构化格式

风险提示

需联网调用外部 API，敏感文档存在数据外传风险
免费额度有限，高频使用可能产生费用
复杂版式或低质量扫描件识别准确率可能下降
API 服务稳定性依赖第三方供应商

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/gumadeiras/llmwhisperer/SKILL.md
来源类型：GitHub 开源项目

数据统计

相关导航

YNAB预算管理

命令行管理YNAB预

OpenAI语音转写

Wallapop CLI工具

二手市场命令行查询工

Pushover手机推送

向手机发送Pusho

X实时搜索

AI演示文稿生成

自然语言生成专业PP

语音合成与识别

为AI代理添加语音能

图片文字提取

从图像中提取文字内容

暂无评论

none

暂无评论...