飞书文档读取器

11分钟前更新 3 00
飞书文档读取器飞书文档读取器
飞书文档读取器

技能简介

该技能通过飞书开放API读取并提取飞书(Lark)文档内容,支持Docx、Sheet、Slide等多种文档类型的结构化数据获取。

业务背景

飞书文档读取器帮助企业自动提取飞书内的Docx、表格、幻灯片等文档内容,将分散在协作平台的资料转化为结构化数据。适用于合同归档、报表汇总、知识沉淀等场景,避免人工复制粘贴的低效与差错,让业务人员快速获取所需信息。

落地案例:财务部门每月需汇总各部门提交的预算表。通过该技能,系统自动读取飞书表格中的多工作表数据,提取关键指标生成统一报告。相比以往逐个打开文档、手动整理,大幅缩短月度结算周期,确保数据口径一致。

能做什么

  • 读取飞书Docx文档的完整内容块与层级结构
  • 提取电子表格的全部数据与多工作表导航
  • 获取幻灯片基础元数据
  • 解析文本、表格、图片、代码块等20余种内容类型
  • 输出结构化JSON格式便于后续处理

使用说明

安装准备

  1. 确保系统已安装 Python 3 和 curl
  2. 克隆技能仓库到本地目录
  3. 创建配置文件 ./reference/feishu_config.json,填入飞书应用凭证:
    {"app_id": "your_feishu_app_id_here", "app_secret": "your_feishu_app_secret_here"}
  4. 设置脚本执行权限:
    chmod +x scripts/read_doc.sh scripts/get_blocks.sh
    chmod 600 ./reference/feishu_config.json

读取文档

# 基础文档读取
./scripts/read_doc.sh "docx_AbCdEfGhIjKlMnOpQrStUv"

# 获取完整内容块结构
./scripts/get_blocks.sh "docx_token"

# 获取指定块及其子块
./scripts/get_blocks.sh "docx_token" "" "true"

输入与输出

项目内容
输入飞书文档Token;文档类型(docx/doc/sheet/slide);可选块ID;可选子块包含标志
输出JSON格式的文档元数据、层级化内容块、纯文本提取、表格结构、图片链接
适用人群企业IT管理员、数据工程师、知识管理专员、需要将飞书内容集成至内部系统的开发者
不包含文档编辑能力、飞书非文档模块、实时同步机制、多平台文档支持

风险提示

  • 配置文件需妥善保管,避免提交至版本控制
  • 飞书应用需申请只读权限,过度授权可能带来数据泄露风险
  • 文档Token暴露可能导致未授权访问
  • API调用受速率限制,高频请求可能触发服务降级

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/snowshadow/feishu-doc-reader/SKILL.md
来源类型:GitHub 开源仓库

数据统计

相关导航

暂无评论

none
暂无评论...