任务处理
任务处理

适合:要检查测试失败或静态检查问题的人、要整理需要修复的代码质量项的人、要先完成一轮代理商评价再继续推进的人。
这个技能适合对 LLM 代理进行测试和基准测试,包括行为测试、能力评估、可靠性指标和生产监控,即使是顶级代理在实际基准上的成绩也低于 50% 使用场合:代理测试、代理评估、基准代理、代理可靠性、测试代理。
它适合在测试或检查刚失败时先做一轮定位,把高优先级问题和修复顺序整理出来。
当团队遇到回归失败、覆盖不足或代码检查不通过时,会先用测试修复整理问题,再安排具体改动和回归。
适合:OpenClaw、Codex、Kimiclaw、Windsurf、Trae、华为 CodeArts。
直接对 OpenClaw 说:
帮我安装一个叫 代理商评价 的 Skill。
如果安装时需要精确名字,就用 skills-collections-agent-evaluation。
装好以后,先用它帮我处理一遍当前任务。
如果需要手动安装,可以用这条命令:
clawhub install skills-collections-agent-evaluation
适合:腾讯Workbuddy、百度Duclaw、字节Arkclaw、智谱Autoclaw、科大讯飞Astronclaw。
SKILL.md 或同名 .md 文件。用刚刚导入的代理商评价,先帮我处理当前任务。
备注:这一种本质上是导入一个 Markdown 文件,给知道安装包里有 .md 文件的人即可。
适合:Claude Code、Cursor、通义灵码、文心快码。
这条 Skill 没有整理出稳定的命令行安装写法,建议优先用方式 1 或方式 2。