UX决策框架
UI设计快速决策工具
通过Shell脚本系统测试Ralph帽子集合预设,支持单预设评估与全量批量测试,输出结构化指标与日志。
帽子集合预设验证工具面向前端开发团队,解决Ralph预设配置上线前的质量管控痛点。通过自动化测试替代人工逐条验证,确保配置变更后功能正确性;批量审计预设库发现潜在UX问题;监控帽子路由性能是否符合Fresh Context设计原则,防止上下文污染导致的体验劣化。
落地案例:某迭代中开发者修改了客服场景的帽子触发规则,需验证新配置是否准确识别用户意图。使用本工具指定该预设名称执行单条测试,脚本自动模拟多轮对话并输出metrics.json——若迭代次数异常增高或同迭代内出现多帽子切换,则提示违反Tenet #1需回滚优化。全量回归时启用后台模式,数小时后通过SUMMARY.md查看整体质量水位。
安装准备
需具备Bash环境,可选安装yq以解析YAML测试任务。将脚本置于./tools/目录,确保执行权限。
单预设评估
./tools/evaluate-preset.sh tdd-red-green claude
全量评估
./tools/evaluate-all-presets.sh claude
Bash工具调用参数
启动后使用TaskOutput工具轮询进度,避免阻塞等待。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 预设名称(如tdd-red-green)、后端类型(claude/kiro)、超时毫秒数、后台运行标志 |
| 输出 | 结构化日志目录(.eval/logs/)、metrics.json指标文件、SUMMARY.md汇总报告、shell退出码 |
| 适用人群 | 预设开发者、QA工程师、帽子路由调优人员、CI/CD集成场景 |
| 不包含 | 图形化报告界面、实时进度推送、Windows原生支持、预设编辑功能 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/paulpete/evaluate-presets/SKILL.md
来源类型:GitHub仓库