Playwright测试审查
系统性扫描端到端测试文件,识别反模式、最佳实践缺失与用例覆盖盲区。
打通模型发布与评估数据闭环的实用工具。一键整合多源评测指标至模型主页,支持主流推理框架的自动化基准测试,提升模型可信度与发现效率。
uv run scripts/evaluation_manager.py get-prs --repo-id "username/model-name"
uv run scripts/evaluation_manager.py --help
hugging-face-evaluation
见下方输入与输出表格。
| 输入 | 输出 |
|---|---|
| 任务目标、输入资料和约束条件;需要处理的平台或对象;结果格式要求 | 结构化结果;执行建议或可交付产物;便于复核的后续说明 |
原始链接:https://github.com/huggingface/skills
来源类型:GitHub 开源仓库