向量内存检索

19分钟前更新 1 00

轻量语义搜索记忆文件

收录时间:
2026-02-26
向量内存检索向量内存检索
向量内存检索

技能简介

Vector Memory Hack 是一套超轻量级语义搜索方案,用于在 AI 代理的记忆文件中快速定位相关内容。基于 TF-IDF 与余弦相似度算法,无需外部依赖即可实现毫秒级检索。

业务背景

解决AI代理读取记忆文件时Token消耗大、响应慢的问题。通过本地轻量索引,让代理秒级定位关键段落,无需加载数千Token的完整文档,显著降低调用成本并提升交互流畅度。适合需要频繁回溯历史信息的个人知识管理场景。

落地案例:某产品经理使用MEMORY.md记录每日决策与灵感。当询问"上周关于定价的讨论"时,传统方式需读取3000+ Token的整份文档。采用向量内存检索后,系统仅返回3个最相关段落(约200 Token),包含具体日期、参与人及结论,代理即时给出精准回应,单次查询成本下降90%。

能做什么

  • 从 MEMORY.md 等 Markdown 文档中秒级提取相关上下文
  • 避免读取完整文件(3000+ Token),仅加载 3-5 个相关段落
  • 支持增量索引更新,只处理变更内容
  • 多语言场景下工作(中文、英文、德文等)

使用说明

安装准备

本技能为纯 Python 标准库实现,无需 pip 安装。将仓库克隆至本地:

git clone https://github.com/openclaw/skills.git
cd skills/mig6671/vector-memory-hack

配置路径

编辑 scripts/vector_search.py 中的以下变量:

MEMORY_PATH = Path("/path/to/your/MEMORY.md")
VECTORS_DIR = Path("/path/to/vectors/storage")

构建索引

python3 scripts/vector_search.py --rebuild

执行搜索

# 使用 CLI 封装
vsearch "backup config rules"

# 或直接调用
python3 scripts/vector_search.py --search "your query" --top-k 5

增量更新

python3 scripts/vector_search.py --update

查看统计

python3 scripts/vector_search.py --stats

输入与输出

见下方输入与输出表格。

项目内容
输入自然语言查询字符串;可选 –top-k 参数;目标 Markdown 文件路径
输出Top-K 相似段落列表(含余弦相似度分数、标题、正文、源位置)
适用人群AI 代理开发者、运维脚本编写者、资源受限环境用户
不包含神经网络嵌入模型、GPU 支持、分布式存储、企业级权限管理

 

风险提示

  • TF-IDF 算法对深层语义理解有限,复杂查询可能返回次优结果
  • 索引文件需定期重建,长期运行可能出现数据膨胀
  • 默认 tokenizer 对中文分词粒度较粗,专业术语识别可能不准
  • 无权限控制机制,敏感记忆文件需自行做好访问隔离

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/mig6671/vector-memory-hack/SKILL.md
来源类型:GitHub 开源仓库

数据统计

相关导航

暂无评论

none
暂无评论...