容器故障排查
Docker容器与C
该技能用于诊断Linux服务器上常见服务故障,结合日志分析、systemd/PM2进程管理、文件权限检查、Nginx反向代理配置验证及DNS解析测试,定位应用无法启动、端口不通或配置错误等问题。
运维团队日常需处理Linux服务异常,如应用无法启动、端口不通或配置错误。本技能通过日志分析、进程状态检查、权限验证及Nginx/DNS配置排查,快速定位故障根因并提供修复方案,减少服务中断时间,降低对开发团队的依赖,提升运维响应效率。
落地案例:某电商平台促销期间,订单服务突然不可用。运维人员提供systemctl status输出显示服务启动失败,并附上journalctl错误日志。AI分析发现是日志目录权限被误改为root所有导致服务无法写入,同时检测到Nginx上游端口配置与实际服务端口不一致。最终给出chmod修复权限、更正proxy_pass配置并重启服务的完整步骤,10分钟内恢复业务。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 服务名称(systemd/PM2)、错误日志或状态输出、可选的Nginx配置/域名/端口/路径 |
| 输出 | 诊断报告(原因分析+证据+修复计划)、确认后的执行命令、验证与回滚步骤 |
| 适用人群 | 运维工程师、后端开发者、技术管理员、管理自建服务器的个人用户 |
| 不包含 | 内核级调试、深度性能分析、安全渗透测试、未经确认的自动命令执行 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/kowl64/linux-service-triage/SKILL.md
来源类型:GitHub仓库