百度语义记忆库

3小时前更新 1 00
百度语义记忆库百度语义记忆库
百度语义记忆库

技能简介

Memory Baidu Embedding DB 是 Clawdbot 的语义记忆系统,采用百度 Embedding-V1 模型实现基于含义而非关键词的记忆存储与检索。作为 LanceDB 等传统向量数据库的本地安全替代方案,所有数据处理均在本地完成。

业务背景

解决传统关键词搜索无法理解语义的痛点,让AI助手真正

落地案例:某技术支持团队使用该系统沉淀过往解决方案。当工程师输入

能做什么

  • 通过自然语言查询语义相关的历史记忆
  • 使用自定义标签和元数据组织记忆内容
  • 在对话中保持用户偏好和上下文连贯性
  • 以 SQLite 本地文件形式持久化存储向量数据
  • 无缝替换现有的 memory-lancedb 记忆系统

使用说明

安装步骤:

  1. 将技能文件放置于 ~/clawd/skills/ 目录
  2. 配置百度千帆 API 凭证环境变量:
    export BAIDU_API_STRING='${BAIDU_API_STRING}'
    export BAIDU_SECRET_KEY='${BAIDU_SECRET_KEY}'
  3. 确保 Python 版本为 3.8 或以上

基础调用示例:

from memory_baidu_embedding_db import MemoryBaiduEmbeddingDB

memory_db = MemoryBaiduEmbeddingDB()

# 添加记忆
memory_db.add_memory(
    content="用户偏好简洁回复,喜欢技术讨论",
    tags=["user-preference", "communication-style"],
    metadata={"importance": "high"}
)

# 语义搜索
results = memory_db.search_memories("用户有什么偏好?", limit=3)

输入与输出

见下方输入与输出表格。

项目内容
输入自然语言查询字符串;可选标签数组用于过滤;整数类型的返回数量限制;字典格式的元数据筛选条件
输出记忆对象列表(含内容、标签、元数据、创建时间);浮点型相似度分数;匹配的记忆条目总数
适用人群Clawdbot 开发者;需要本地向量存储的技术团队;重视数据隐私的企业用户;具备百度 API 访问权限的开发者
不包含自动化的 API 密钥申请流程;云端托管的数据备份服务;多语言嵌入模型支持;实时同步的集群部署能力

 

风险提示

  • 需妥善保管百度 API 密钥,避免泄露
  • 依赖百度云端 API,网络中断时无法生成新向量
  • 大规模数据下 SQLite 性能可能下降
  • 向量维度固定为 384,与其他模型不兼容

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/xqicxx/memory-baidu-embedding-db/SKILL.md
来源类型:GitHub 开源仓库

数据统计

相关导航

暂无评论

none
暂无评论...