注入检测防护

3小时前更新 1 00

双层内容安全过滤

收录时间：

2026-02-26

手机查看

注入检测防护

技能简介

本技能为智能体提供输入与输出的双层内容安全防护，识别并拦截潜在的提示词注入、恶意代码插入及其他安全风险内容。

业务背景

智能体在对外服务时面临提示词注入、恶意代码等安全威胁。本技能通过输入输出双层过滤，自动识别攻击意图与敏感信息泄露风险，帮助企业守住AI交互的安全底线，避免数据泄露或系统被操控，保障业务合规稳定运行。

落地案例：某企业客服智能体上线后，遭遇用户尝试通过特殊指令诱导模型绕过权限校验。启用注入检测防护后，系统自动标记该输入为

能做什么

检测用户输入中的提示词注入攻击
过滤模型输出中的敏感信息泄露
识别SQL注入、命令注入等代码攻击模式
阻断跨站脚本(XSS)等Web安全威胁

使用说明

安装指令

# 通过OpenClaw CLI安装
openclaw skill install zskyx/detect-injection

# 或通过GitHub直接引用
pip install git+https://github.com/openclaw/skills.git#subdirectory=skills/zskyx/detect-injection

配置步骤

在智能体配置文件中启用该技能
设置检测敏感度级别（低/中/高）
配置自定义黑名单规则（可选）
指定拦截后的处理动作（阻断/告警/记录）

输入与输出

见下方输入与输出表格。

项目	内容
输入	用户输入文本、模型输出文本、对话上下文、检测配置参数
输出	安全检测结果、风险类型标签、置信度评分、建议动作、脱敏内容
适用人群	金融风控系统开发者、企业AI安全管理员、智能体平台运营方
不包含	网络层防护、终端杀毒、数据加密、身份认证功能

风险提示

过度严格的过滤可能影响正常业务交互体验
新型攻击手法可能存在检测盲区，需定期更新规则库
多语言混合输入场景下可能出现误报
加密或编码后的攻击载荷可能绕过静态检测

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/zskyx/detect-injection/SKILL.md
来源类型：开源社区技能

数据统计

暂无评论

暂无评论...

注入检测防护

技能简介

业务背景

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

知乎圈子运营助手

WhatsApp消息格式化

微软365助手

Reddit命令行浏览

SMTP快捷发信

Telegram消息整理

主权安全通告

ClawEmail邮箱管理

暂无评论

标签云