AI演示文稿生成
自然语言生成专业PP
Tabstack Extractor 通过 Tabstack API 从网站提取结构化数据,支持基于 JSON Schema 的数据抽取和 Markdown 格式转换。
1. 安装 Babashka
curl -s https://raw.githubusercontent.com/babashka/babashka/master/install | bash
2. 配置 API Key
export TABSTACK_API_KEY="your_api_key_here"
或在 ~/.config/tabstack/config.edn 写入 {:api-key "your_api_key_here"}
3. 测试连接
bb scripts/tabstack.clj test
4. 提取 Markdown
bb scripts/tabstack.clj markdown "https://example.com"
5. 提取 JSON(需准备 schema 文件)
bb scripts/tabstack.clj json "https://example.com" references/simple_article.json
6. 高级用法
# 带重试
bb scripts/tabstack.clj json-retry "URL" schema.json
# 带缓存(24小时)
bb scripts/tabstack.clj json-cache "URL" schema.json
# 批量处理
bb scripts/tabstack.clj batch urls.txt schema.json
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 目标网页URL;JSON Schema 定义文件(可选);TABSTACK_API_KEY 环境变量 |
| 输出 | Markdown 格式网页正文;符合 Schema 的 JSON 结构化数据;批量任务执行报告 |
| 适用人群 | 需要自动化采集网页数据的开发者、数据分析师、研究人员 |
| 不包含 | 免费无限制的 API 调用;自动破解反爬机制;图形化操作界面 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/noblepayne/tabstack-extractor/SKILL.md
来源类型:开源社区技能