注入检测防护

3小时前更新 1 00
注入检测防护注入检测防护
注入检测防护

技能简介

本技能为智能体提供输入与输出的双层内容安全防护,识别并拦截潜在的提示词注入、恶意代码插入及其他安全风险内容。

业务背景

智能体在对外服务时面临提示词注入、恶意代码等安全威胁。本技能通过输入输出双层过滤,自动识别攻击意图与敏感信息泄露风险,帮助企业守住AI交互的安全底线,避免数据泄露或系统被操控,保障业务合规稳定运行。

落地案例:某企业客服智能体上线后,遭遇用户尝试通过特殊指令诱导模型绕过权限校验。启用注入检测防护后,系统自动标记该输入为

能做什么

  • 检测用户输入中的提示词注入攻击
  • 过滤模型输出中的敏感信息泄露
  • 识别SQL注入、命令注入等代码攻击模式
  • 阻断跨站脚本(XSS)等Web安全威胁

使用说明

安装指令

# 通过OpenClaw CLI安装
openclaw skill install zskyx/detect-injection

# 或通过GitHub直接引用
pip install git+https://github.com/openclaw/skills.git#subdirectory=skills/zskyx/detect-injection

配置步骤

  1. 在智能体配置文件中启用该技能
  2. 设置检测敏感度级别(低/中/高)
  3. 配置自定义黑名单规则(可选)
  4. 指定拦截后的处理动作(阻断/告警/记录)

输入与输出

见下方输入与输出表格。

项目内容
输入用户输入文本、模型输出文本、对话上下文、检测配置参数
输出安全检测结果、风险类型标签、置信度评分、建议动作、脱敏内容
适用人群金融风控系统开发者、企业AI安全管理员、智能体平台运营方
不包含网络层防护、终端杀毒、数据加密、身份认证功能

 

风险提示

  • 过度严格的过滤可能影响正常业务交互体验
  • 新型攻击手法可能存在检测盲区,需定期更新规则库
  • 多语言混合输入场景下可能出现误报
  • 加密或编码后的攻击载荷可能绕过静态检测

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/zskyx/detect-injection/SKILL.md
来源类型:开源社区技能

数据统计

相关导航

暂无评论

none
暂无评论...