谷歌全文搜索
搜索并提取网页完整内
RAGLite 是一款本地优先的 RAG(检索增强生成)缓存工具,用于将文档转换为结构化 Markdown 后建立本地索引,支持通过向量数据库和关键词进行混合查询。该工具不替代模型记忆或对话上下文,而是为代理提供一个持久化存储和检索未训练数据的私有空间。
企业可将内部文档、技术手册、个人笔记等私有资料转化为可检索的知识库,解决敏感数据不便上传云端的问题。通过本地向量索引与关键词混合检索,快速定位分散在多份文件中的关键信息,提升知识复用效率。
落地案例:某研发团队积累大量技术方案文档和会议纪要,使用工具将/docs目录下的PDF和Word文件一键蒸馏为结构化Markdown,建立名为"tech-kb"的本地索引。后续成员查询"用户认证流程如何设计"时,系统同时匹配向量语义和相关关键词,从12份分散文档中聚合出完整的实现方案和注意事项,避免重复翻阅原始文件。
安装步骤:
./scripts/install.shskills/raglite/.venv 创建独立虚拟环境raglite-chromadb,CLI 命令保持为 raglite运行流程:
./scripts/raglite.sh run /path/to/docs --out ./raglite_out --collection my-docs --chroma-url http://127.0.0.1:8100 --skip-existing --skip-indexed --nodes./scripts/raglite.sh query "how does X work?" --out ./raglite_out --collection my-docs --chroma-url http://127.0.0.1:8100见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 本地文档目录路径、Chroma 服务地址、集合名称、查询语句 |
| 输出 | 结构化 Markdown 文件、Chroma 向量索引、查询结果文本 |
| 适用人群 | 需要本地处理敏感文档的用户、希望避免云服务的隐私场景、重复查询固定知识库的工作流、技术团队内部文档管理 |
| 不包含 | 云端托管向量数据库、实时网络爬虫功能、多用户协作权限管理、模型训练或微调能力 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/virajsanghvi1/raglite/SKILL.md
来源类型:GitHub 开源仓库