错误守护技能

15分钟前更新 1 00
错误守护技能错误守护技能
错误守护技能

技能简介

error-guard 是 OpenClaw 平台的系统级控制平面安全技能,用于防止智能体在执行长时间或高风险任务时出现死锁、冻结和不可恢复状态。该技能提供非阻塞的控制命令,无需调用大语言模型或外部 API,可在容器不重启的情况下完成系统恢复。

业务背景

在长周期任务、子智能体协作或后台监控场景中,智能体可能因资源竞争或逻辑异常陷入死锁。该技能提供不依赖外部服务的自愈能力,运维人员无需重启容器即可快速诊断系统健康、识别卡滞任务并执行紧急恢复,显著降低人工介入成本和业务中断时间。

落地案例:某企业部署的财务对账智能体在月末批量处理时突然无响应,控制台心跳停止超过10分钟。运维人员通过/error-guard执行/status发现三个任务处于卡滞状态,随即调用/flush取消所有活动任务并清空消息队列,2分钟内完成系统恢复,避免了整晚批处理作业的中断。

能做什么

  • 实时检查系统健康状态和任务注册表
  • 识别卡滞或超期的运行中任务
  • 一键取消所有活动任务并清空消息队列
  • 终止活跃的进程会话
  • 执行安全的恢复序列,重置控制平面状态

使用说明

安装指令:原始文档未提供具体安装命令,需通过 OpenClaw 技能管理器安装 amar1432/error-guard

使用方法

  1. 运行 /status 查看当前活跃任务、启动时间、最后心跳及卡滞标记
  2. 发现系统无响应时,执行 /flush 进行紧急停止
  3. 需要完整恢复时,执行 /recover 依次完成刷新、状态重置和可选的技能重载

注意事项:此技能面向理解 OpenClaw 执行模型的进阶用户,适用于长周期任务、子智能体、基准测试、后台监控等场景。

输入与输出

见下方输入与输出表格。

项目内容
输入控制命令(/status、/flush、/recover);可选的任务标识参数
输出JSON格式的系统健康报告;任务注册表状态列表;操作执行确认
适用人群理解OpenClaw执行模型的进阶用户;运行长周期任务或高风险工作负载的开发者
不包含业务逻辑代码;LLM调用能力;用户数据持久化;后台自动轮询机制

 

风险提示

  • /flush 会立即取消所有活动任务,可能导致进行中工作中断
  • 该技能操作于控制平面层级,误用可能影响系统稳定性
  • 仅追踪任务元数据,不处理业务逻辑或用户数据
  • 未来扩展功能(子智能体运行器、任务看门狗等)尚未实现

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/amar1432/error-guard/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...