文档解析提取

2小时前更新 7 00
文档解析提取文档解析提取
文档解析提取

技能简介

Upstage Document Parse 是一款文档内容提取技能,支持从 PDF、图片、Office 文档等格式中抽取文本、表格、图表及布局元素,输出为结构化数据。

能做什么

  • 解析 PDF、PNG、JPG、DOCX、PPTX、XLSX、HWP 等格式
  • 提取文字、表格、图片、图表及其坐标位置
  • 输出 HTML、Markdown、纯文本等多种格式
  • 支持同步接口(20页内)与异步接口(1000页)
  • 强制 OCR 处理扫描件

使用说明

1. 安装技能

openclaw install upstage-document-parse

2. 配置 API 密钥

Upstage Console 获取密钥后执行:

openclaw config set skills.entries.upstage-document-parse.apiKey "your-api-key"

或在配置文件 ~/.openclaw/openclaw.json 中添加对应字段。

3. 调用示例

"Parse this PDF: ~/Documents/report.pdf"
"Parse: ~/Documents/report.jpg"

4. 高级参数

通过 curl 直接调用时可指定:model(document-parse/document-parse-nightly)、mode(standard/enhanced/auto)、ocr(auto/force)、output_formats、coordinates、chart_recognition 等。

输入与输出

见下方输入与输出表格。

项目内容
输入PDF、图片、DOCX、PPTX、XLSX、HWP 等格式文件;UPSTAGE_API_KEY;可选解析参数
输出结构化内容(HTML/Markdown/Text)、元素明细(含坐标与类别)、页面统计
适用人群金融文档处理人员、档案数字化团队、企业知识库建设者
不包含文档编辑、智能摘要、翻译服务、离线运行能力

 

风险提示

  • 需妥善保管 UPSTAGE_API_KEY,避免泄露
  • 异步任务结果下载链接有效期为30天
  • 合并跨页表格功能限制最多20页
  • 大文件建议使用异步接口避免超时
  • 图表识别功能处于 Beta 阶段

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/upstage-deployment/upstage-document-parse/SKILL.md
来源类型:开源技能仓库

数据统计

相关导航

暂无评论

none
暂无评论...