灵活数据导入器
多格式数据自动入库工
将豆瓣账号中的书籍、影视、音乐、游戏四类收藏数据导出为本地CSV文件,支持全量抓取与RSS增量同步两种模式,输出格式兼容Obsidian等笔记工具。
环境准备
# 克隆仓库
git clone https://github.com/openclaw/skills.git
cd skills/cosformula/douban-sync-skill
# 安装依赖
npm install
配置环境变量
export DOUBAN_USER="你的豆瓣用户ID"
# 可选:自定义输出目录,默认为 ~/douban-sync
export DOUBAN_OUTPUT_DIR="/path/to/output"
首次全量导出
需登录豆瓣账号,使用浏览器工具抓取所有分页:
# 方式一:Puppeteer CDP(需启动浏览器)
node scripts/douban-browser-scraper.mjs
# 方式二:纯HTTP请求(可能被限流)
node scripts/douban-scraper.mjs
抓取范围覆盖四类内容的三种状态(已完/进行中/想标记),每页30条,自动翻页至末页。请求间隔2-3秒,触发限流时等待30秒后重试。
日常增量同步
无需登录,通过RSS源获取更新:
node scripts/douban-rss-sync.mjs
建议添加cron定时任务实现每日自动运行。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 豆瓣用户ID;可选输出目录路径;全量模式需浏览器登录态 |
| 输出 | 四个CSV文件(书.csv、影视.csv、音乐.csv、游戏.csv),含标题、链接、日期、评分、状态、短评六列 |
| 适用人群 | 豆瓣重度用户、本地数据备份需求者、Obsidian等笔记软件使用者 |
| 不包含 | 非收藏类内容(日记/广播/小组);他人数据;评分预测;云托管服务 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/cosformula/douban-sync-skill/SKILL.md
来源类型:GitHub仓库