文档文字提取

2小时前更新 6 00
文档文字提取文档文字提取
文档文字提取

技能简介

LLMWhisperer 是一个基于 API 的文档解析工具,可从图片和 PDF 文件中提取文字内容并保留原始版式结构,对手写体和复杂表格有较好支持。

能做什么

  • 从扫描件、照片中提取可编辑文字
  • 解析 PDF 发票、合同、报表等金融单据
  • 保留段落、表格等原始排版信息
  • 处理手写笔记和签名区域

使用说明

  1. 获取 API Key:访问 unstract.com/llmwhisperer 注册免费账户(每日 100 页额度)
  2. 配置环境变量:
    echo "LLMWHISPERER_API_KEY=your_key_here" >> ~/.clawdbot/.env
  3. 执行提取命令:
    llmwhisperer <文件路径>
  4. 保存结果到文件:
    llmwhisperer invoice.pdf > output.txt

输入与输出

见下方输入与输出表格。

项目内容
输入本地图片文件(JPG/PNG)或 PDF 文档;需配置 LLMWHISPERER_API_KEY
输出JSON 格式文本,包含提取的文字内容及版式保留标记
适用人群金融单据处理人员、档案数字化工作者、需要解析手写材料的用户
不包含离线识别能力、自动分类归档、直接生成 Excel 等结构化格式

 

风险提示

  • 需联网调用外部 API,敏感文档存在数据外传风险
  • 免费额度有限,高频使用可能产生费用
  • 复杂版式或低质量扫描件识别准确率可能下降
  • API 服务稳定性依赖第三方供应商

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gumadeiras/llmwhisperer/SKILL.md
来源类型:GitHub 开源项目

数据统计

相关导航

暂无评论

none
暂无评论...