论文自动摘要技能

15分钟前更新 1 00
论文自动摘要技能论文自动摘要技能
论文自动摘要技能

技能简介

Agentic Paper Digest 是一个自动化论文摘要工具,可从 arXivHugging Face 抓取最新论文,通过 LLM 进行相关性筛选与内容总结,输出结构化 JSON 数据或启动本地 API 服务供下游调用。

业务背景

研发团队需要持续跟踪学术前沿动态,但多平台手动检索效率低下。本技能实现论文监控自动化,支持按自定义主题词和机构权重智能过滤,输出标准化数据供内部系统对接,让技术情报收集从被动搜索变为主动推送,确保关键创新不被遗漏。

落地案例:某算法团队建立每日论文早报机制,通过API模式部署服务,配置topics.json定义3个研究方向(多模态、推理优化、评测方法),设置机构加权优先关注顶尖实验室成果。定时触发任务后,系统自动生成结构化数据集,经内部看板渲染为可交互的论文卡片,团队成员按需深度阅读。

能做什么

  • 按时间窗口抓取 arXiv 和 Hugging Face 最新论文
  • 基于主题关键词进行 LLM 相关性评分与过滤
  • 生成论文标题、摘要、PDF首页文本的结构化摘要
  • 输出 JSON 格式结果或启动 REST API 服务
  • 支持自定义主题配置、机构加权、模型参数调整

使用说明

  1. 环境准备:确保已安装 Python 3,配置网络访问,准备 OpenAI API Key(OPENAI_API_KEY)或兼容的 LiteLLM 端点(LITELLM_API_BASE + LITELLM_API_KEY
  2. 安装部署:执行引导脚本自动下载代码
    bash "{baseDir}/scripts/bootstrap.sh"
    如需指定目录:
    PROJECT_DIR="$HOME/agentic_paper_digest" bash "{baseDir}/scripts/bootstrap.sh"
  3. CLI 运行
    bash "{baseDir}/scripts/run_cli.sh"
    带参数示例:
    bash "{baseDir}/scripts/run_cli.sh" --window-hours 24 --sources arxiv,hf --json
  4. API 模式(可选)
    启动服务:bash "{baseDir}/scripts/run_api.sh"
    触发任务:curl -X POST http://127.0.0.1:8000/api/run
    查询状态:curl http://127.0.0.1:8000/api/status
    获取结果:curl http://127.0.0.1:8000/api/papers
    停止服务:bash "{baseDir}/scripts/stop_api.sh"
  5. 配置调整:编辑 PROJECT_DIR/config/topics.json 定义关注主题,config/settings.json 调整抓取限制,.env 文件设置 API Key 与模型参数

输入与输出

见下方输入与输出表格。

项目内容
输入时间窗口时长、数据源选择(arxiv/hf)、主题关键词配置、OpenAI/LiteLLM API Key、可选的机构加权规则与模型参数
输出JSON 格式论文摘要(含标题、作者、摘要、相关性评分)、SQLite 数据库文件、REST API 端点响应、运行统计元数据
适用人群AI/ML 领域研究人员、文献推荐系统开发者、自动化科研流程的实验室团队、需要论文数据接入 Agent 工作流的技术用户
不包含非 arXiv/Hugging Face 来源的论文、全文深度解读(仅提取首页 PDF 文本)、人工级别的同行评审判断、多语言自动翻译功能

 

风险提示

  • 需有效 LLM API Key,否则 relevance/summary 流程将失败
  • arXiv API 有请求频率限制,频繁调用可能触发封禁
  • PDF 文本提取需额外安装 PyMuPDF(pip install pymupdf),未安装时该功能静默跳过
  • 配置文件须为严格 JSON 格式,尾随逗号会导致解析失败
  • API 模式默认监听本地端口,生产环境需自行配置反向代理与认证

来源信息

原始链接:https://github.com/matanle51/agentic_paper_digest
来源类型:GitHub 开源项目

原始链接:https://github.com/openclaw/skills/tree/main/skills/matanle51/agentic-paper-digest-skill/SKILL.md

来源类型:github

数据统计

相关导航

暂无评论

none
暂无评论...