文档解析提取

2小时前更新 7 00

多格式文档结构化提取

收录时间：

2026-02-26

手机查看

文档解析提取

技能简介

Upstage Document Parse 是一款文档内容提取技能，支持从 PDF、图片、Office 文档等格式中抽取文本、表格、图表及布局元素，输出为结构化数据。

能做什么

解析 PDF、PNG、JPG、DOCX、PPTX、XLSX、HWP 等格式
提取文字、表格、图片、图表及其坐标位置
输出 HTML、Markdown、纯文本等多种格式
支持同步接口（20页内）与异步接口（1000页）
强制 OCR 处理扫描件

使用说明

1. 安装技能

openclaw install upstage-document-parse

2. 配置 API 密钥

从 Upstage Console 获取密钥后执行：

openclaw config set skills.entries.upstage-document-parse.apiKey "your-api-key"

或在配置文件 ~/.openclaw/openclaw.json 中添加对应字段。

3. 调用示例

"Parse this PDF: ~/Documents/report.pdf"
"Parse: ~/Documents/report.jpg"

4. 高级参数

通过 curl 直接调用时可指定：model（document-parse/document-parse-nightly）、mode（standard/enhanced/auto）、ocr（auto/force）、output_formats、coordinates、chart_recognition 等。

输入与输出

见下方输入与输出表格。

项目	内容
输入	PDF、图片、DOCX、PPTX、XLSX、HWP 等格式文件；UPSTAGE_API_KEY；可选解析参数
输出	结构化内容（HTML/Markdown/Text）、元素明细（含坐标与类别）、页面统计
适用人群	金融文档处理人员、档案数字化团队、企业知识库建设者
不包含	文档编辑、智能摘要、翻译服务、离线运行能力

风险提示

需妥善保管 UPSTAGE_API_KEY，避免泄露
异步任务结果下载链接有效期为30天
合并跨页表格功能限制最多20页
大文件建议使用异步接口避免超时
图表识别功能处于 Beta 阶段

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/upstage-deployment/upstage-document-parse/SKILL.md
来源类型：开源技能仓库

数据统计

暂无评论

暂无评论...

文档解析提取

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

Exa神经搜索

Mermaid图表渲染

GIMHub代码托管

MailChannels邮件发送

fal.ai图像生成

Instapaper书签管理

法律文档智能处理

PDF快速解析

暂无评论

标签云