会话记忆延续
AI异步反思与记忆整
Vector Memory Hack 是一套超轻量级语义搜索方案,用于在 AI 代理的记忆文件中快速定位相关内容。基于 TF-IDF 与余弦相似度算法,无需外部依赖即可实现毫秒级检索。
解决AI代理读取记忆文件时Token消耗大、响应慢的问题。通过本地轻量索引,让代理秒级定位关键段落,无需加载数千Token的完整文档,显著降低调用成本并提升交互流畅度。适合需要频繁回溯历史信息的个人知识管理场景。
落地案例:某产品经理使用MEMORY.md记录每日决策与灵感。当询问"上周关于定价的讨论"时,传统方式需读取3000+ Token的整份文档。采用向量内存检索后,系统仅返回3个最相关段落(约200 Token),包含具体日期、参与人及结论,代理即时给出精准回应,单次查询成本下降90%。
安装准备
本技能为纯 Python 标准库实现,无需 pip 安装。将仓库克隆至本地:
git clone https://github.com/openclaw/skills.git
cd skills/mig6671/vector-memory-hack
配置路径
编辑 scripts/vector_search.py 中的以下变量:
MEMORY_PATH = Path("/path/to/your/MEMORY.md")
VECTORS_DIR = Path("/path/to/vectors/storage")
构建索引
python3 scripts/vector_search.py --rebuild
执行搜索
# 使用 CLI 封装
vsearch "backup config rules"
# 或直接调用
python3 scripts/vector_search.py --search "your query" --top-k 5
增量更新
python3 scripts/vector_search.py --update
查看统计
python3 scripts/vector_search.py --stats
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 自然语言查询字符串;可选 –top-k 参数;目标 Markdown 文件路径 |
| 输出 | Top-K 相似段落列表(含余弦相似度分数、标题、正文、源位置) |
| 适用人群 | AI 代理开发者、运维脚本编写者、资源受限环境用户 |
| 不包含 | 神经网络嵌入模型、GPU 支持、分布式存储、企业级权限管理 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/mig6671/vector-memory-hack/SKILL.md
来源类型:GitHub 开源仓库