reMarkable云同步
推送文档至电子墨水平
DeepRead是AI原生的OCR生产级API,通过多模型共识机制将PDF和图像转换为高精度结构化数据。系统对不确定字段自动标记人工复核标识,把人工审核工作量从100%降至5-10%,无需编写提示词。
DeepRead解决企业文档数字化中OCR准确率与人工成本的矛盾。传统方案需100%人工核对,而该产品通过多模型共识机制自动识别不确定字段,仅将5%-10%的存疑内容推入人工复核流程,大幅降低审核工作量,同时保障数据质量。
落地案例:财务部门每月处理上千张发票和合同。使用DeepRead后,系统自动提取金额、日期、供应商等关键信息并输出带置信度评分的JSON数据;对模糊印章或手写备注等低置信度字段自动标记hil_flag,财务人员只需在内置界面集中复核这些标记项,无需逐份翻阅原始文件。
1. 获取API密钥
访问 https://www.deepread.tech/dashboard 注册并创建API密钥。
2. 配置环境变量
export DEEPREAD_API_KEY="sk_live_your_key_here"
3. 处理首份文档(Webhook方式)
curl -X POST https://api.deepread.tech/v1/process \
-H "X-API-Key: $DEEPREAD_API_KEY" \
-F "file=@document.pdf" \
-F "webhook_url=https://your-app.com/webhooks/deepread"
返回任务ID后立即响应,处理完成后(约2-5分钟)向指定Webhook推送结果。
4. 轮询方式获取结果
# 上传文档
curl -X POST https://api.deepread.tech/v1/process \
-H "X-API-Key: $DEEPREAD_API_KEY" \
-F "file=@document.pdf"
# 轮询状态
curl https://api.deepread.tech/v1/jobs/JOB_ID \
-H "X-API-Key: $DEEPREAD_API_KEY"
5. 结构化数据提取
curl -X POST https://api.deepread.tech/v1/process \
-H "X-API-Key: $DEEPREAD_API_KEY" \
-F "file=@invoice.pdf" \
-F 'schema={"type":"object","properties":{"vendor":{"type":"string"},"total":{"type":"number"}}}'
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | PDF文件或图像(JPG/PNG);可选JSON Schema定义提取字段;可选Webhook回调地址 |
| 输出 | Markdown文本、带置信度评分的结构化JSON、需人工复核字段标记(hil_flag)、处理元数据 |
| 适用人群 | 财务自动化团队、法务合规部门、档案数字化项目组、RPA流程开发者 |
| 不包含 | 本地私有化部署、自定义模型微调、实时流式识别、复杂表格版式还原 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/uday390/deepread-ocr/SKILL.md
来源类型:GitHub仓库