本地RAG缓存本地RAG缓存
本地RAG缓存

技能简介

RAGLite 是一个本地优先的 RAG(检索增强生成)缓存工具,用于将文档蒸馏为结构化 Markdown 后建立索引,支持向量相似度与关键词混合检索。

能做什么

  • 将各类文档压缩为低冗余的结构化 Markdown
  • 使用 Chroma 在本地建立可持久化的向量索引
  • 通过向量相似度 + ripgrep 关键词实现混合检索
  • 保留人类可读的中间产物,便于审计与版本控制

使用说明

安装步骤

  1. 确保系统已安装 Python 3.11+、pip、ripgrep(brew install ripgrep
  2. 克隆技能仓库后执行:
    ./scripts/install.sh
  3. 该脚本会自动创建隔离虚拟环境并从 GitHub 安装 raglite

运行流程

  1. 启动 Chroma 服务(默认 http://127.0.0.1:8100
  2. 执行完整管道:
    ./scripts/raglite.sh run /path/to/docs --out ./raglite_out --collection my-docs --chroma-url http://127.0.0.1:8100 --skip-existing --skip-indexed --nodes
  3. 查询内容:
    ./scripts/raglite.sh query ./raglite_out --collection my-docs --top-k 5 --keyword-top-k 5 "查询语句"

输入与输出

见下方输入与输出表格。

项目内容
输入本地文档目录、Chroma 服务地址、集合名称、查询语句
输出结构化 Markdown 文件、Chroma 向量索引、元数据缓存目录
适用人群注重数据隐私的个人用户、需低成本本地检索的开发者
不包含云端向量数据库服务、模型记忆管理、自动化服务部署

 

风险提示

  • Chroma 服务未启动会导致索引或查询失败
  • 缺少 ripgrep 时关键词检索功能不可用
  • OpenClaw 引擎需要配置网关地址与访问令牌
  • 敏感数据虽存本地,仍需注意文件系统权限管理

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/virajsanghvi1/virajsanghvi1-raglite/SKILL.md
来源类型:GitHub 开源项目

数据统计

相关导航

暂无评论

none
暂无评论...