代理商评价

2天前更新 0 00

代理商评价

收录时间：

2026-03-14

下载技能安装md文件

保存原始技能说明，便于离线查看、转存和审查。

下载技能安装md文件

Openclaw技能导航开发与编程 # 代码开发 # 开发者 # 测试工程师

代理商评价

适用人群

适合：要检查测试失败或静态检查问题的人、要整理需要修复的代码质量项的人、要先完成一轮代理商评价再继续推进的人。

技能介绍

这个技能适合对 LLM 代理进行测试和基准测试，包括行为测试、能力评估、可靠性指标和生产监控，即使是顶级代理在实际基准上的成绩也低于 50% 使用场合：代理测试、代理评估、基准代理、代理可靠性、测试代理。

它适合在测试或检查刚失败时先做一轮定位，把高优先级问题和修复顺序整理出来。

业务背景和落地案例

当团队遇到回归失败、覆盖不足或代码检查不通过时，会先用测试修复整理问题，再安排具体改动和回归。

能做什么

检查测试失败或静态检查问题。
整理需要修复的代码质量项。
输出回归验证建议。

安装方法

方式 1：对 OpenClaw 说（不用写代码）

适合：OpenClaw、Codex、Kimiclaw、Windsurf、Trae、华为 CodeArts。

直接对 OpenClaw 说：

帮我安装一个叫 代理商评价 的 Skill。
如果安装时需要精确名字，就用 skills-collections-agent-evaluation。
装好以后，先用它帮我处理一遍当前任务。

如果需要手动安装，可以用这条命令：

clawhub install skills-collections-agent-evaluation

方式 2：导入 MD 安装

适合：腾讯Workbuddy、百度Duclaw、字节Arkclaw、智谱Autoclaw、科大讯飞Astronclaw。

找到这条 Skill 自带的 Markdown 文件，通常就是它的 SKILL.md 或同名 .md 文件。
把这个 Markdown 文件导入到你的产品里。
导入完成后，直接对 AI 说：

用刚刚导入的代理商评价，先帮我处理当前任务。

备注：这一种本质上是导入一个 Markdown 文件，给知道安装包里有 .md 文件的人即可。

方式 3：代码安装

适合：Claude Code、Cursor、通义灵码、文心快码。

这条 Skill 没有整理出稳定的命令行安装写法，建议优先用方式 1 或方式 2。

使用步骤

先选上面 3 种方式里，自己最容易完成的一种。
安装完成后，直接对 OpenClaw 说：“用代理商评价帮我处理当前任务。” 先让它自己跑一遍就可以。
如果你已经有明确文件、网址、目录或数据，再把它补给 OpenClaw，让它只处理这一部分。
先看第一轮结果，再决定要不要追加条件、缩小范围或继续执行下一步。
如果这条 Skill 确实好用，就把它保留在常用列表，后面重复任务直接复用。

你需要准备什么

与你当前任务相关的文件、网址、目录或数据。
失败用例、Lint 结果或测试报告。
相关代码片段或仓库路径。
你希望优先修复的范围。

你会看到什么结果

测试失败原因和修复建议。
需要回归的关键点。
可继续执行的代码修改方向。

风险提示

涉及 API Key、Token 或其他凭证时，先确认保存方式和权限边界。

来源信息

公开页面地址: https://agentskillsrepo.com/skill/boisenoise/skills-collections-agent-evaluation
SKILL.md 下载地址: https://agentskillsrepo.com/skill/boisenoise/skills-collections-agent-evaluation/download

数据统计

任务处理

界面设计

代码格式化程序

📕 小红书全能助手

任务处理

内容总结专家

内容总结

界面设计

健康记录

语音处理

暂无评论

暂无评论...

代理商评价

代理商评价

适用人群

技能介绍

业务背景和落地案例

能做什么

安装方法

方式 1：对 OpenClaw 说（不用写代码）

方式 2：导入 MD 安装

方式 3：代码安装

使用步骤

你需要准备什么

你会看到什么结果

风险提示

来源信息

数据统计

相关导航

任务处理

界面设计

代码格式化程序

📕 小红书全能助手

内容总结专家

界面设计

健康记录

语音处理

暂无评论

标签云