DeepRead智能文档识别

3分钟前更新 1 00
DeepRead智能文档识别DeepRead智能文档识别
DeepRead智能文档识别

技能简介

DeepRead是AI原生的OCR生产级API,通过多模型共识机制将PDF和图像转换为高精度结构化数据。系统对不确定字段自动标记人工复核标识,把人工审核工作量从100%降至5-10%,无需编写提示词。

业务背景

DeepRead解决企业文档数字化中OCR准确率与人工成本的矛盾。传统方案需100%人工核对,而该产品通过多模型共识机制自动识别不确定字段,仅将5%-10%的存疑内容推入人工复核流程,大幅降低审核工作量,同时保障数据质量。

落地案例:财务部门每月处理上千张发票和合同。使用DeepRead后,系统自动提取金额、日期、供应商等关键信息并输出带置信度评分的JSON数据;对模糊印章或手写备注等低置信度字段自动标记hil_flag,财务人员只需在内置界面集中复核这些标记项,无需逐份翻阅原始文件。

能做什么

  • 文本提取:将PDF和图像转为整洁的Markdown格式
  • 结构化数据:提取带置信度评分的JSON字段
  • 人机协同复核:内置HIL界面,仅对标记字段(hil_flag)进行人工审核
  • 多轮处理:多次验证确保最高准确率
  • 多模型交叉验证:提升结果可靠性

使用说明

1. 获取API密钥

访问 https://www.deepread.tech/dashboard 注册并创建API密钥。

2. 配置环境变量

export DEEPREAD_API_KEY="sk_live_your_key_here"

3. 处理首份文档(Webhook方式)

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf" \
  -F "webhook_url=https://your-app.com/webhooks/deepread"

返回任务ID后立即响应,处理完成后(约2-5分钟)向指定Webhook推送结果。

4. 轮询方式获取结果

# 上传文档
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf"

# 轮询状态
curl https://api.deepread.tech/v1/jobs/JOB_ID \
  -H "X-API-Key: $DEEPREAD_API_KEY"

5. 结构化数据提取

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F 'schema={"type":"object","properties":{"vendor":{"type":"string"},"total":{"type":"number"}}}'

输入与输出

见下方输入与输出表格。

项目内容
输入PDF文件或图像(JPG/PNG);可选JSON Schema定义提取字段;可选Webhook回调地址
输出Markdown文本、带置信度评分的结构化JSON、需人工复核字段标记(hil_flag)、处理元数据
适用人群财务自动化团队、法务合规部门、档案数字化项目组、RPA流程开发者
不包含本地私有化部署、自定义模型微调、实时流式识别、复杂表格版式还原

 

风险提示

  • 需妥善保管API密钥,避免硬编码到配置文件
  • 免费额度为每月2000页,超出需付费
  • 部分模糊或遮挡字段会被标记为需人工复核
  • Webhook接收端需做好安全验证,防止伪造请求

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/uday390/deepread-ocr/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...