语义安全扫描器

1小时前更新 1 00

检测技能中的自然语言

收录时间：

2026-02-26

手机查看

语义安全扫描器

技能简介

SenseGuard 是面向 OpenClaw 技能的语义安全扫描工具，专门识别传统代码扫描器无法发现的自然语言安全威胁。它将 SKILL.md 视为代理指令进行分析，而非普通文本文件。

业务背景

传统代码扫描工具难以识别自然语言中隐藏的安全威胁，如恶意指令注入或隐蔽的数据外泄行为。SenseGuard 将技能文档视为代理指令进行深度语义分析，帮助企业在使用 AI 技能前主动发现提示注入、零宽字符混淆等高级攻击手段，降低因第三方技能带来的数据泄露与系统操控风险。

落地案例：某团队引入外部开发的 OpenClaw 技能后，使用 SenseGuard 执行扫描。工具在 SKILL.md 中发现一条看似无害的注释，经语义分析识别出隐藏的 "忽略先前所有指令" 提示注入攻击，同时标记了试图修改 MEMORY.md 实现持久化控制的指令。扫描报告给出风险评分与具体行号定位，使安全团队在部署前及时阻断该技能，避免了潜在的系统权限失控。

能做什么

检测提示注入攻击（如”忽略先前所有指令”）
发现数据外泄行为（如隐藏的 curl 请求）
识别零宽字符等混淆手段
标记持久化攻击（如修改 MEMORY.md 的指令）
输出带评分的风险报告与修复建议

使用说明

安装依赖后执行扫描命令：

# 进入技能目录后运行
python3 scripts/scanner.py --target <skill名称或路径>

常用选项：

--target all — 扫描全部已安装技能
--deep — 强制启用 LLM 语义分析（第二层）
--no-cache — 跳过缓存结果
--json — 输出原始 JSON 供后续处理

第二层语义分析：当 --json 输出包含 layer2_prompt 字段时，将其作为安全审计任务处理，再将结果回传以生成最终评分。

输入与输出

见下方输入与输出表格。

项目	内容
输入	目标技能名称或本地路径；可选参数 –target/–deep/–no-cache/–json
输出	Markdown风险报告（评分0-100，等级SAFE/CAUTION/DANGEROUS/MALICIOUS）；规则ID、证据文本、行号；修复建议；可选JSON数据
适用人群	OpenClaw技能开发者、安全审计人员、平台运营方、企业内控合规团队
不包含	操作系统级恶意软件检测、二进制文件分析、网络流量监控、运行时沙箱分析

风险提示

CRITICAL 级别发现需立即采取行动
LLM 语义分析可能产生额外 API 调用成本
缓存结果可能遗漏最新修改的风险点
扫描结果仅供参考，不构成法律安全保证

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/fermionoid/senseguard/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

语义安全扫描器

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

AI代理工作市场

Ralph迭代开发循环

内在之光框架

ARBITER安全通告

Chum Cloud 反派网络

供应链安全演示

AI浮动头像组件

IP地址地理查询

暂无评论

标签云