网关安全重启网关安全重启
网关安全重启

技能简介

restart-guard 提供一套完整的 OpenClaw Gateway 安全重启机制,在重启前自动保存会话上下文,重启后执行健康验证,并在异常时发送告警通知。

业务背景

网关升级或配置变更时,业务会话常因重启中断导致用户体验受损。本机制在重启前自动保存完整上下文,重启后验证服务健康状态,确保网关平滑过渡。若验证失败即时告警,帮助运维团队快速介入,避免故障扩大,保障业务连续性。

落地案例:某电商平台需调整网关限流策略,运维人员执行:python3 scripts/write_context.py –config config.yaml –reason "config change" –verify 'openclaw health –json' 'ok' –resume "report restart result to user"。系统生成上下文文件后触发重启,守护进程持续监控。重启完成后自动运行健康检查,确认返回"ok"后标记成功;若超时或输出不符,立即通过多渠道发送告警并保留诊断日志,便于快速回滚。

能做什么

  • 重启前自动生成包含验证命令和恢复步骤的上下文文件
  • 触发网关重启并启动独立守护进程监控重启过程
  • 重启完成后自动运行预定义的验证命令集
  • 验证失败或超时时发送多渠道故障通知
  • 内置冷却锁、连续失败限制和配置备份等保护机制

使用说明

前置条件

  • openclaw.json 中设置 commands.restart: true
  • Agent 拥有 gatewayexec 工具权限
  • 复制 config.example.yaml 填写参数后通过 --config 传入

安装指令

# 克隆技能仓库
git clone https://github.com/openclaw/skills.git
# 进入技能目录
cd skills/zjianru/restart-guard
# 复制并编辑配置文件
cp config.example.yaml config.yaml
# 编辑 config.yaml 填入通知渠道等参数

执行流程

  1. 写入上下文(重启前执行):
    python3 scripts/write_context.py \
      --config config.yaml \
      --reason "config change" \
      --verify 'openclaw health --json' 'ok' \
      --resume "report restart result to user"
  2. 触发重启:
    python3 scripts/restart.py --config config.yaml --reason "config change"
  3. 重启后验证(由守护进程自动调用或手动执行):
    python3 scripts/postcheck.py --config config.yaml

输入与输出

见下方输入与输出表格。

项目内容
输入重启原因、配置文件路径、验证命令与预期输出、恢复步骤描述
输出上下文 YAML 文件、重启结果通知、健康验证报告、故障诊断日志与告警
适用人群需要安全重启 OpenClaw Gateway 并保留上下文的运维人员与自动化 Agent
不包含网关安装初始化、其他网关类型重启、无权限环境的重启操作

 

风险提示

  • 冷却锁默认 600 秒,频繁重启请求会被拒绝
  • 连续失败 3 次后自动停止重启尝试
  • 守护进程依赖 start_new_session=True 实现重启后存活,错误配置会导致监控中断
  • 验证命令输出匹配采用字符串相等比较,格式变化会导致误判
  • 通知渠道需提前配置,全部失败时将丢失告警信息

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/zjianru/restart-guard/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...