飞书文档读取器

11分钟前更新 3 00

提取飞书文档内容

收录时间：

2026-02-25

手机查看

飞书文档读取器

技能简介

该技能通过飞书开放API读取并提取飞书（Lark）文档内容，支持Docx、Sheet、Slide等多种文档类型的结构化数据获取。

业务背景

飞书文档读取器帮助企业自动提取飞书内的Docx、表格、幻灯片等文档内容，将分散在协作平台的资料转化为结构化数据。适用于合同归档、报表汇总、知识沉淀等场景，避免人工复制粘贴的低效与差错，让业务人员快速获取所需信息。

落地案例：财务部门每月需汇总各部门提交的预算表。通过该技能，系统自动读取飞书表格中的多工作表数据，提取关键指标生成统一报告。相比以往逐个打开文档、手动整理，大幅缩短月度结算周期，确保数据口径一致。

能做什么

读取飞书Docx文档的完整内容块与层级结构
提取电子表格的全部数据与多工作表导航
获取幻灯片基础元数据
解析文本、表格、图片、代码块等20余种内容类型
输出结构化JSON格式便于后续处理

使用说明

安装准备

确保系统已安装 Python 3 和 curl
克隆技能仓库到本地目录

创建配置文件 ./reference/feishu_config.json，填入飞书应用凭证：

{"app_id": "your_feishu_app_id_here", "app_secret": "your_feishu_app_secret_here"}

设置脚本执行权限：

chmod +x scripts/read_doc.sh scripts/get_blocks.sh
chmod 600 ./reference/feishu_config.json

读取文档

# 基础文档读取
./scripts/read_doc.sh "docx_AbCdEfGhIjKlMnOpQrStUv"

# 获取完整内容块结构
./scripts/get_blocks.sh "docx_token"

# 获取指定块及其子块
./scripts/get_blocks.sh "docx_token" "" "true"

输入与输出

项目	内容
输入	飞书文档Token；文档类型（docx/doc/sheet/slide）；可选块ID；可选子块包含标志
输出	JSON格式的文档元数据、层级化内容块、纯文本提取、表格结构、图片链接
适用人群	企业IT管理员、数据工程师、知识管理专员、需要将飞书内容集成至内部系统的开发者
不包含	文档编辑能力、飞书非文档模块、实时同步机制、多平台文档支持

风险提示

配置文件需妥善保管，避免提交至版本控制
飞书应用需申请只读权限，过度授权可能带来数据泄露风险
文档Token暴露可能导致未授权访问
API调用受速率限制，高频请求可能触发服务降级

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/snowshadow/feishu-doc-reader/SKILL.md
来源类型：GitHub 开源仓库

数据统计

暂无评论

暂无评论...

飞书文档读取器

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

CAPTCHAS验证集成

谷歌日历管理

智能体观测面板

Alexa设备控制

需求驱动设计

Notion数据管理

AI智能体招聘板

PPT大纲生成器

暂无评论

标签云