OpenAI文档查询
官方开发文档检索工具
Firecrawler 是一个基于 Firecrawl API 的网页抓取与爬取工具,支持将任意网站转换为结构化数据,适用于数据采集、内容监控等场景。
安装依赖
pip install firecrawl-py
配置 API Key
在环境变量中设置 FIRECRAWL_API_KEY,或在代码中直接传入。
基础用法示例
from firecrawl import FirecrawlApp
app = FirecrawlApp(api_key="your-api-key")
# 抓取单页
result = app.scrape_url("https://example.com")
print(result["markdown"])
# 爬取整站
crawl_result = app.crawl_url("https://example.com", params={"limit": 100})
print(crawl_result)
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 目标网址(URL)、爬取参数(深度限制、输出格式)、Firecrawl API 密钥 |
| 输出 | Markdown 正文、结构化 JSON、爬取状态报告 |
| 适用人群 | 数据工程师、内容运营、市场研究人员、AI 应用开发者 |
| 不包含 | 代理管理、浏览器指纹定制、图形化界面、数据存储服务 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/andrewdmwalker/firecrawler/SKILL.md
来源类型:GitHub 开源技能