智能模型路由

3小时前更新 2 00
智能模型路由智能模型路由
智能模型路由

技能简介

根据任务复杂度自动选择最便宜的Claude模型:Haiku处理简单查询,Sonnet承担标准工作,Opus应对复杂推理。通过三级递进策略降低50%-90%的API调用成本。

业务背景

智能模型路由让AI调用成本可控。系统根据任务复杂度自动匹配Claude三级模型:简单问答走低价Haiku,标准任务用Sonnet,复杂推理才启用Opus。避免"杀鸡用牛刀"的浪费,在保障输出质量的同时显著压缩API支出。

落地案例:客服团队处理用户咨询时,常规问题由Haiku快速应答;遇到需多步骤排查的技术故障,系统自动切换Sonnet分析日志并给出修复方案;仅当涉及系统架构改造等深度决策时,才调用Opus生成详细评估报告。全程无需人工判断该用哪个模型,后台按规则自动完成最优选择。

能做什么

  • 自动判断任务类型并分配合适模型
  • 按成本从低到高逐级升级,避免过度消费
  • 支持子代理和定时任务的模型指定
  • 提供清晰的决策树快速参考

使用说明

安装指令:该技能为配置型规则,无需额外安装,直接在调用Claude API时通过model参数指定层级。

使用方式

  1. 默认所有请求使用Haiku($0.25/M输入)
  2. 当任务涉及10行以上代码、多步分析或超过3段落写作时,升级到Sonnet($3.00/M输入)
  3. 遇到架构决策、复杂调试或需要30秒以上专注思考的任务,升级到Opus($15.00/M输入)
  4. 子代理调用示例:sessions_spawn(task="检查备份状态", model="haiku")
  5. 定时任务默认使用Haiku,除非确实需要推理能力

输入与输出

见下方输入与输出表格。

项目内容
输入自然语言任务描述;可选model参数(haiku/sonnet/opus);相关上下文文件
输出选定模型生成的文本响应;实际调用模型标识;成本等级标记
适用人群日均调用Claude API超过100次的开发者;关注API账单的技术团队负责人;构建多代理系统的架构师
不包含GPT/ Gemini等其他模型家族的支持;硬性成本上限熔断机制;调用历史的可视化仪表盘

 

风险提示

  • 模型选择错误可能导致成本浪费或响应质量不足
  • Haiku无法处理超过10行的代码生成任务
  • 复杂任务若未正确升级至Opus,可能得到次优结果
  • 需人工复核关键生产决策,不可完全依赖自动路由

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/millibus/smart-model-switching/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...