YouTube数据提取
从YouTube提取
OpenGraph.io 提供网页数据提取、页面截图和 AI 图像生成服务,支持从任意 URL 获取结构化元数据、渲染后的 HTML 内容或可视化截图。
市场、运营和产品团队常需快速获取竞品网页信息、生成社交分享素材或批量采集公开数据。该工具通过API直接抓取任意网页的结构化元数据、可视化截图及核心内容,省去人工复制粘贴的繁琐操作,让内容调研、社媒运营和数据分析效率大幅提升。
落地案例:某电商运营团队每周需监控50个竞品店铺的促销页面。他们调用网页数据提取工具,批量获取商品标题、价格和主图链接,同时截取页面快照存档。遇到需要快速制作活动海报时,团队用AI图像生成功能输入英文提示词,直接产出符合品牌规范的社交卡片,无需设计排期。
1. 注册获取 API 密钥
访问 dashboard.opengraph.io 注册账号,免费版每月提供 100 次站点/截图/抓取请求及 4 次图像生成额度。
2. 安装与配置
环境变量方式:
export OPENGRAPH_APP_ID="YOUR_APP_ID"
Clawdbot 配置文件方式(~/.clawdbot/clawdbot.json):
{
"skills": {
"entries": {
"opengraph-io": {
"apiKey": "YOUR_APP_ID"
}
}
}
}
可选 MCP 服务器安装:
npm install -g opengraph-io-mcp
3. 调用示例
提取 OG 标签:
curl -s "https://opengraph.io/api/1.1/site/$(echo -n 'https://example.com' | jq -sRr @uri)?app_id=${OPENGRAPH_APP_ID}"
捕获截图(尺寸可选 sm/md/lg/xl):
curl -s "https://opengraph.io/api/1.1/screenshot/$(echo -n 'https://example.com' | jq -sRr @uri)?app_id=${OPENGRAPH_APP_ID}&dimensions=lg"
抓取 HTML(支持代理绕过地理限制):
curl -s "https://opengraph.io/api/1.1/scrape/$(echo -n 'https://example.com' | jq -sRr @uri)?app_id=${OPENGRAPH_APP_ID}&use_proxy=true"
提取特定元素:
curl -s "https://opengraph.io/api/1.1/extract/$(echo -n 'https://example.com' | jq -sRr @uri)?app_id=${OPENGRAPH_APP_ID}&html_elements=h1,h2,p"
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 目标网页 URL;API 密钥 OPENGRAPH_APP_ID;可选参数包括尺寸规格(sm/md/lg/xl)、代理开关(use_proxy)、HTML元素选择器(html_elements)、图像生成提示词及类型(kind) |
| 输出 | 结构化元数据JSON(含标题/描述/图片等);截图文件URL;渲染后的完整HTML;提取的指定DOM元素内容;AI生成的图像文件URL |
| 适用人群 | 需批量提取网页数据的开发者、构建链接预览功能的产品团队、进行网页存档的运营人员、需要快速生成社交素材的设计师、基于网页内容做知识整理的研究者 |
| 不包含 | 可视化图形操作界面;突破反爬机制的强制抓取能力;本地离线文件的处理;持续实时监控告警;复杂的多步骤自动化流程编排 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/primeobsession/opengraph-io-skill/SKILL.md
来源类型:GitHub 仓库