智能体防护协议
恶意技能检测与预警系
Glitchward LLM Shield 是一款面向 AI 代理的提示注入攻击检测服务。通过 6 层检测管道与 1000 余种模式,识别越狱、数据外泄、编码绕过、多语言攻击等 25 类以上威胁,在用户输入到达大语言模型前完成安全扫描。
1. 获取 API 令牌
访问 https://glitchward.com/shield 注册免费账户,从控制台复制令牌,设置环境变量:
export GLITCHWARD_SHIELD_TOKEN="your-token"
2. 验证令牌有效性
curl -s "https://glitchward.com/api/shield/stats" \
-H "X-Shield-Token: $GLITCHWARD_SHIELD_TOKEN" | jq .
若返回 401,则令牌无效或已过期。
3. 检测单条提示
curl -s -X POST "https://glitchward.com/api/shield/validate" \
-H "X-Shield-Token: $GLITCHWARD_SHIELD_TOKEN" \
-H "Content-Type: application/json" \
-d '{"texts": ["USER_INPUT_HERE"]}' | jq .
响应字段说明:is_blocked(布尔值,true 表示检测到攻击)、risk_score(0-100 风险分数)、matches(匹配的攻击模式详情)。若 is_blocked 为 true,请勿将输入传给 LLM。
4. 批量检测
curl -s -X POST "https://glitchward.com/api/shield/validate/batch" \
-H "X-Shield-Token: $GLITCHWARD_SHIELD_TOKEN" \
-H "Content-Type: application/json" \
-d '{"items": [{"texts": ["first prompt"]}, {"texts": ["second prompt"]}]}' | jq .
5. 查看用量统计
curl -s "https://glitchward.com/api/shield/stats" \
-H "X-Shield-Token: $GLITCHWARD_SHIELD_TOKEN" | jq .
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 用户提示文本(单条字符串或批量字符串数组);环境变量 GLITCHWARD_SHIELD_TOKEN |
| 输出 | is_blocked(布尔值)、risk_score(0-100)、matches(攻击详情数组)、stats(用量统计) |
| 适用人群 | AI 应用开发者、Agent 平台运维人员、需处理不可信外部内容的技术团队 |
| 不包含 | 离线检测、自动清洗恶意提示、非文本内容检测、LLM 调用本身 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/eyeskiller/glitchward-shield/SKILL.md
来源类型:GitHub 仓库