向量内存检索

19分钟前更新 1 00

轻量语义搜索记忆文件

收录时间：

2026-02-26

手机查看

向量内存检索

技能简介

Vector Memory Hack 是一套超轻量级语义搜索方案，用于在 AI 代理的记忆文件中快速定位相关内容。基于 TF-IDF 与余弦相似度算法，无需外部依赖即可实现毫秒级检索。

业务背景

解决AI代理读取记忆文件时Token消耗大、响应慢的问题。通过本地轻量索引，让代理秒级定位关键段落，无需加载数千Token的完整文档，显著降低调用成本并提升交互流畅度。适合需要频繁回溯历史信息的个人知识管理场景。

落地案例：某产品经理使用MEMORY.md记录每日决策与灵感。当询问"上周关于定价的讨论"时，传统方式需读取3000+ Token的整份文档。采用向量内存检索后，系统仅返回3个最相关段落（约200 Token），包含具体日期、参与人及结论，代理即时给出精准回应，单次查询成本下降90%。

能做什么

从 MEMORY.md 等 Markdown 文档中秒级提取相关上下文
避免读取完整文件（3000+ Token），仅加载 3-5 个相关段落
支持增量索引更新，只处理变更内容
多语言场景下工作（中文、英文、德文等）

使用说明

安装准备

本技能为纯 Python 标准库实现，无需 pip 安装。将仓库克隆至本地：

git clone https://github.com/openclaw/skills.git
cd skills/mig6671/vector-memory-hack

配置路径

编辑 scripts/vector_search.py 中的以下变量：

MEMORY_PATH = Path("/path/to/your/MEMORY.md")
VECTORS_DIR = Path("/path/to/vectors/storage")

构建索引

python3 scripts/vector_search.py --rebuild

执行搜索

# 使用 CLI 封装
vsearch "backup config rules"

# 或直接调用
python3 scripts/vector_search.py --search "your query" --top-k 5

增量更新

python3 scripts/vector_search.py --update

查看统计

python3 scripts/vector_search.py --stats

输入与输出

见下方输入与输出表格。

项目	内容
输入	自然语言查询字符串；可选 –top-k 参数；目标 Markdown 文件路径
输出	Top-K 相似段落列表（含余弦相似度分数、标题、正文、源位置）
适用人群	AI 代理开发者、运维脚本编写者、资源受限环境用户
不包含	神经网络嵌入模型、GPU 支持、分布式存储、企业级权限管理

风险提示

TF-IDF 算法对深层语义理解有限，复杂查询可能返回次优结果
索引文件需定期重建，长期运行可能出现数据膨胀
默认 tokenizer 对中文分词粒度较粗，专业术语识别可能不准
无权限控制机制，敏感记忆文件需自行做好访问隔离

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/mig6671/vector-memory-hack/SKILL.md
来源类型：GitHub 开源仓库

数据统计

暂无评论

暂无评论...

向量内存检索

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

会话记忆延续

飞书消息回溯

智能体记忆管理

Nextcloud管理助手

Obsidian知识库管理

协作Markdown编辑

卡片盒笔记系统

推特书签智能排序

暂无评论

标签云