语义安全扫描器

1小时前更新 1 00
语义安全扫描器语义安全扫描器
语义安全扫描器

技能简介

SenseGuard 是面向 OpenClaw 技能的语义安全扫描工具,专门识别传统代码扫描器无法发现的自然语言安全威胁。它将 SKILL.md 视为代理指令进行分析,而非普通文本文件。

业务背景

传统代码扫描工具难以识别自然语言中隐藏的安全威胁,如恶意指令注入或隐蔽的数据外泄行为。SenseGuard 将技能文档视为代理指令进行深度语义分析,帮助企业在使用 AI 技能前主动发现提示注入、零宽字符混淆等高级攻击手段,降低因第三方技能带来的数据泄露与系统操控风险。

落地案例:某团队引入外部开发的 OpenClaw 技能后,使用 SenseGuard 执行扫描。工具在 SKILL.md 中发现一条看似无害的注释,经语义分析识别出隐藏的 "忽略先前所有指令" 提示注入攻击,同时标记了试图修改 MEMORY.md 实现持久化控制的指令。扫描报告给出风险评分与具体行号定位,使安全团队在部署前及时阻断该技能,避免了潜在的系统权限失控。

能做什么

  • 检测提示注入攻击(如”忽略先前所有指令”)
  • 发现数据外泄行为(如隐藏的 curl 请求)
  • 识别零宽字符等混淆手段
  • 标记持久化攻击(如修改 MEMORY.md 的指令)
  • 输出带评分的风险报告与修复建议

使用说明

安装依赖后执行扫描命令:

# 进入技能目录后运行
python3 scripts/scanner.py --target <skill名称或路径>

常用选项:

  • --target all — 扫描全部已安装技能
  • --deep — 强制启用 LLM 语义分析(第二层)
  • --no-cache — 跳过缓存结果
  • --json — 输出原始 JSON 供后续处理

第二层语义分析:当 --json 输出包含 layer2_prompt 字段时,将其作为安全审计任务处理,再将结果回传以生成最终评分。

输入与输出

见下方输入与输出表格。

项目内容
输入目标技能名称或本地路径;可选参数 –target/–deep/–no-cache/–json
输出Markdown风险报告(评分0-100,等级SAFE/CAUTION/DANGEROUS/MALICIOUS);规则ID、证据文本、行号;修复建议;可选JSON数据
适用人群OpenClaw技能开发者、安全审计人员、平台运营方、企业内控合规团队
不包含操作系统级恶意软件检测、二进制文件分析、网络流量监控、运行时沙箱分析

 

风险提示

  • CRITICAL 级别发现需立即采取行动
  • LLM 语义分析可能产生额外 API 调用成本
  • 缓存结果可能遗漏最新修改的风险点
  • 扫描结果仅供参考,不构成法律安全保证

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/fermionoid/senseguard/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...