AgentMail邮件集成
AI代理专用邮箱AP
Bright Data API 网页抓取与搜索工具,通过 Web Unlocker 绕过机器人检测和验证码,将任意网页转换为 Markdown,或获取结构化的 Google 搜索结果。
Bright Data网页采集帮助企业突破反爬限制,稳定获取公开网络数据。无论是抓取竞品官网动态还是批量获取Google搜索结果,都能自动处理验证码和机器人检测,将杂乱网页转化为结构化信息,支撑商业决策与数据分析。
落地案例:某咨询公司需定期监测行业政策变化,使用Bright Data配置目标政府网站URL,系统自动绕过访问限制抓取最新公告页面,输出干净Markdown格式存入知识库。同时执行Google搜索获取相关政策解读文章的结构化列表,实现一手信息与二手资料的双轨采集。
1. 安装前准备
注册 Bright Data 账号并获取 API Key:Bright Data Dashboard
2. 创建 Web Unlocker Zone
登录控制台后点击右上角 “Add”,选择 “Unlocker zone” 创建区域。
3. 配置环境变量
export BRIGHTDATA_API_KEY="your-api-key"
export BRIGHTDATA_UNLOCKER_ZONE="your-zone-name"
4. 执行搜索
bash scripts/search.sh "搜索关键词" [页码]
页码参数可选,从 0 开始计数,用于分页。
5. 执行网页抓取
bash scripts/scrape.sh "https://example.com"
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 搜索关键词 / 目标网页URL;可选分页游标;BRIGHTDATA_API_KEY 和 BRIGHTDATA_UNLOCKER_ZONE 环境变量 |
| 输出 | JSON格式搜索结果(含标题、链接、描述数组)或 Markdown 格式网页正文 |
| 适用人群 | 数据工程师、爬虫开发者、需要绕过反爬机制获取公开网页信息的用户 |
| 不包含 | Bright Data 账号及付费套餐、非网页类 API 接口、自定义代理配置选项 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/meirkad/bright-data/SKILL.md
来源类型:GitHub 仓库