单次提示词测试

3小时前更新 2 00

快速测试与优化AI提

收录时间：

2026-02-25

手机查看

单次提示词测试

技能简介

Singleshot 是一款命令行工具，用于单次执行 AI 提示词并生成详细的成本与性能报告。它支持多模型提供商（OpenAI、Anthropic、Ollama 等），可快速验证提示词效果、对比不同配置的成本差异，帮助在正式部署前完成优化。

能做什么

测试新提示词的 Token 消耗与响应质量
对比不同模型或同一模型的参数变体
生成包含成本、耗时、Token 用量的结构化报告
批量测试多个提示词配置文件
本地免费测试（通过 Ollama）

使用说明

安装

# macOS 通过 Homebrew
brew tap vincentzhangz/singleshot
brew install singleshot

# 或通过 Rust 工具链
cargo install singleshot

基础用法

每次测试务必添加 -d（详细指标）和 -r（保存报告）选项：

# 直接测试提示词
singleshot chat -p "你的提示词" -P openai -d -r report.md

# 使用配置文件测试
singleshot chat -l config.md -d -r report.md

# 对比不同提供商
singleshot chat -p "测试" -P openai -m gpt-4o-mini -d -r openai.md
singleshot chat -p "测试" -P anthropic -m claude-sonnet-4-20250514 -d -r anthropic.md

配置环境变量

export OPENAI_API_KEY="sk-..."
export ANTHROPIC_API_KEY="sk-ant-..."
export OPENROUTER_API_KEY="sk-or-..."

优化流程示例

生成基准报告：singleshot chat -p "原始提示词" -P openai -d -r baseline.md
查看指标：cat baseline.md，记录 Token 数与成本
修改提示词（精简系统指令、添加长度限制）
再次测试并对比两份报告的 Total Cost 与 Total Tokens

输入与输出

见下方输入与输出表格。

项目	内容
输入	提示词文本/配置文件、模型提供商、模型名称、系统指令、Token上限、报告保存路径
输出	Markdown报告（Token用量、成本估算、响应时间）、命令行实时指标
适用人群	关注API成本的开发者、频繁调试提示词的工程师、进行模型选型的技术团队
不包含	自动化A/B测试、提示词版本管理、团队协作功能、可视化界面

风险提示

未设置 --max-tokens 可能导致意外高额输出费用
API 密钥需妥善保管，避免硬编码到脚本中
生产环境部署前务必用目标模型做最终验证
Ollama 本地测试虽无费用，但模型行为可能与云端版本存在差异

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/vincentzhangz/singleshot-prompt-testing/SKILL.md
来源类型：GitHub 仓库

数据统计

暂无评论

暂无评论...

单次提示词测试

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

macOS界面自动化

医疗器械合规指引

X/Twitter浏览器操控

Ecto迁移生成器

WhatsApp消息管理

以色列铁路查询

WhatsApp消息工具

智谱代码助手

暂无评论

标签云