豆瓣收藏同步

4小时前更新 1 00

导出并同步豆瓣书影音

收录时间:
2026-02-26
豆瓣收藏同步豆瓣收藏同步
豆瓣收藏同步

技能简介

将豆瓣账号中的书籍、影视、音乐、游戏四类收藏数据导出为本地CSV文件,支持全量抓取与RSS增量同步两种模式,输出格式兼容Obsidian等笔记工具。

能做什么

  • 一次性导出全部历史收藏记录(读过/在看/想看等状态)
  • 通过RSS每日自动同步新增条目,无需重复登录
  • 生成按类别分文件的CSV数据,便于本地管理与分析
  • 自动去重,多次运行不会重复写入相同条目

使用说明

环境准备

# 克隆仓库
git clone https://github.com/openclaw/skills.git
cd skills/cosformula/douban-sync-skill

# 安装依赖
npm install

配置环境变量

export DOUBAN_USER="你的豆瓣用户ID"
# 可选:自定义输出目录,默认为 ~/douban-sync
export DOUBAN_OUTPUT_DIR="/path/to/output"

首次全量导出

需登录豆瓣账号,使用浏览器工具抓取所有分页:

# 方式一:Puppeteer CDP(需启动浏览器)
node scripts/douban-browser-scraper.mjs

# 方式二:纯HTTP请求(可能被限流)
node scripts/douban-scraper.mjs

抓取范围覆盖四类内容的三种状态(已完/进行中/想标记),每页30条,自动翻页至末页。请求间隔2-3秒,触发限流时等待30秒后重试。

日常增量同步

无需登录,通过RSS源获取更新:

node scripts/douban-rss-sync.mjs

建议添加cron定时任务实现每日自动运行。

输入与输出

见下方输入与输出表格。

项目内容
输入豆瓣用户ID;可选输出目录路径;全量模式需浏览器登录态
输出四个CSV文件(书.csv、影视.csv、音乐.csv、游戏.csv),含标题、链接、日期、评分、状态、短评六列
适用人群豆瓣重度用户、本地数据备份需求者、Obsidian等笔记软件使用者
不包含非收藏类内容(日记/广播/小组);他人数据;评分预测;云托管服务

 

风险提示

  • 全量导出需保持豆瓣登录状态,Cookie过期后需重新登录
  • 频繁请求可能触发豆瓣反爬机制,导致IP暂时受限
  • RSS同步依赖公开订阅源,私密标记或删除内容不会出现在RSS中
  • 部分下架条目在列表中显示为空位,实际抓取数量可能少于页面显示

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/cosformula/douban-sync-skill/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...