文档智能提取

1小时前更新 1 00

PDF与图片转结构化

收录时间：

2026-02-26

手机查看

文档智能提取

技能简介

DocStrange 是 Nanonets 提供的文档提取 API，支持将 PDF、图片等文件转换为 Markdown、JSON 或 CSV 格式，并附带字段级置信度评分。

业务背景

将非结构化的纸质单据、扫描件转化为可直接使用的结构化数据，消除人工录入环节。财务、采购等部门可批量处理发票、合同等文档，缩短单据处理周期，同时通过置信度评分识别存疑字段，保障数据准确性。

落地案例：应付会计收到供应商PDF发票后，调用API提取金额、税号、开票日期等字段，直接写入ERP系统。对于手写备注或模糊印章区域，系统标记低置信度提示人工复核，避免将错误数据导入账务流程。月度数百张发票的处理时间从两天压缩至数小时。

能做什么

OCR 识别扫描件与图片中的文字内容
提取发票、收据中的关键字段（金额、日期、供应商等）
将表格结构转换为 CSV 或 JSON 数据
输出带坐标信息的版面分析结果
处理多页文档的异步提取任务

使用说明

1. 获取 API Key

访问 https://docstrange.nanonets.com/app 注册并获取密钥。

2. 安装配置

推荐通过环境变量配置（无需额外安装包）：

export DOCSTRANGE_API_KEY="your_api_key_here"

OpenClaw 配置示例：

{
  skills: {
    entries: {
      "docstrange": {
        enabled: true
      }
    }
  }
}

3. 基础调用

curl -X POST "https://extraction-api.nanonets.com/api/v1/extract/sync" \
  -H "Authorization: Bearer $DOCSTRANGE_API_KEY" \
  -F "file=@document.pdf" \
  -F "output_format=markdown"

4. 提取指定字段（JSON 输出）

curl -X POST "https://extraction-api.nanonets.com/api/v1/extract/sync" \
  -H "Authorization: Bearer $DOCSTRANGE_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "output_format=json" \
  -F 'json_options=["invoice_number","date","total_amount"]'

5. 大文档异步处理

# 提交任务
curl -X POST "https://extraction-api.nanonets.com/api/v1/extract/async" ...

# 轮询结果
curl -X GET "https://extraction-api.nanonets.com/api/v1/extract/results/{record_id}" ...

输入与输出

见下方输入与输出表格。

项目	内容
输入	PDF、PNG、JPG 等格式的文档或图片文件；输出格式参数；可选字段列表或 JSON Schema
输出	Markdown 文本、JSON 结构化数据、CSV 表格；附带置信度评分与元数据
适用人群	需要自动化文档处理的开发者、财务系统建设者、企业信息化团队
不包含	音视频处理、手写体识别、设计稿解析、流式实时处理

风险提示

API Key 需妥善保管，避免硬编码在代码仓库中
配置文件建议设置权限 chmod 600 ~/.openclaw/openclaw.json
同步接口限制 5 页以内文档，超出请使用异步模式
置信度评分低于阈值时需人工复核提取结果
定期轮换 API Key 以降低泄露风险

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/shhdwi/docstrange/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

文档智能提取

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

网页文档转PDF

法律文档智能处理

AI社交网络平台

Last.fm音乐数据查询

Late社交发布API

质量文档管控

波特兰公交查询

会话记忆延续

暂无评论

标签云