Exa神经搜索
AI驱动的网络与代码
Upstage Document Parse 是一款文档内容提取技能,支持从 PDF、图片、Office 文档等格式中抽取文本、表格、图表及布局元素,输出为结构化数据。
1. 安装技能
openclaw install upstage-document-parse
2. 配置 API 密钥
从 Upstage Console 获取密钥后执行:
openclaw config set skills.entries.upstage-document-parse.apiKey "your-api-key"
或在配置文件 ~/.openclaw/openclaw.json 中添加对应字段。
3. 调用示例
"Parse this PDF: ~/Documents/report.pdf"
"Parse: ~/Documents/report.jpg"
4. 高级参数
通过 curl 直接调用时可指定:model(document-parse/document-parse-nightly)、mode(standard/enhanced/auto)、ocr(auto/force)、output_formats、coordinates、chart_recognition 等。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | PDF、图片、DOCX、PPTX、XLSX、HWP 等格式文件;UPSTAGE_API_KEY;可选解析参数 |
| 输出 | 结构化内容(HTML/Markdown/Text)、元素明细(含坐标与类别)、页面统计 |
| 适用人群 | 金融文档处理人员、档案数字化团队、企业知识库建设者 |
| 不包含 | 文档编辑、智能摘要、翻译服务、离线运行能力 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/upstage-deployment/upstage-document-parse/SKILL.md
来源类型:开源技能仓库