批量推理任务管理

59分钟前更新 2 00
批量推理任务管理批量推理任务管理
批量推理任务管理

技能简介

该技能用于通过 Doubleword API 创建和管理批量推理任务,支持将多个 AI 请求打包成 JSONL 文件进行异步处理,适合大规模推理场景。

业务背景

企业需要处理海量AI推理请求时,单条调用易触发速率限制且成本高昂。该技能支持将数千个请求打包为JSONL文件异步处理,规避实时调用的性能瓶颈与费用压力,同时通过自定义ID实现请求与结果精准映射,满足大规模数据标注、内容生成等场景的高效运转需求。

落地案例:某电商平台需对10万件商品描述进行多语言翻译。运营团队将待翻译文本按JSONL格式封装(含商品SKU作为custom_id),选择24小时完成窗口创建批处理作业。系统自动轮询进度,3小时后获取results.jsonl,通过custom_id将译文回填至对应商品后台,失败条目单独下载错误日志人工复核,全程无需逐条调用API。

能做什么

  • 批量提交多个独立 AI 请求,避免单条调用触发速率限制
  • 上传 JSONL 格式请求文件并创建异步批处理作业
  • 轮询监控批处理进度,获取完成状态和结果文件
  • 下载输出结果和错误日志,映射自定义 ID 与响应内容
  • 选择 24 小时或 1 小时完成窗口,平衡成本与时效

使用说明

前置准备

需获取 Doubleword API 密钥(DOUBLEWORD_API_KEY),API 端点为 https://api.doubleword.ai/v1

完整工作流程

  1. 创建 JSONL 请求文件
    每行一个 JSON 对象,包含 custom_idmethodurlbody 字段。文件大小上限 200MB。

    {"custom_id": "req-1", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "anthropic/claude-3-5-sonnet", "messages": [{"role": "user", "content": "What is 2+2?"}]}}
  2. 上传文件
    curl https://api.doubleword.ai/v1/files \
      -H "Authorization: Bearer $DOUBLEWORD_API_KEY" \
      -F purpose="batch" \
      -F file="@batch_requests.jsonl"

    保存返回的 id 作为文件 ID。

  3. 创建批处理作业
    curl https://api.doubleword.ai/v1/batches \
      -H "Authorization: Bearer $DOUBLEWORD_API_KEY" \
      -H "Content-Type: application/json" \
      -d '{"input_file_id": "file-abc123", "endpoint": "/v1/chat/completions", "completion_window": "24h"}'

    completion_window 可选 24h(更省成本)或 1h(溢价 50%)。

  4. 轮询状态
    curl https://api.doubleword.ai/v1/batches/batch-xyz789 \
      -H "Authorization: Bearer $DOUBLEWORD_API_KEY"

    状态流转:validating → in_progress → completed。建议每 30-60 秒查询一次。

  5. 下载结果
    curl https://api.doubleword.ai/v1/files/file-output123/content \
      -H "Authorization: Bearer $DOUBLEWORD_API_KEY" > results.jsonl

    若存在失败请求,通过 error_file_id 下载错误日志。

输入与输出

见下方输入与输出表格。

项目内容
输入JSONL格式请求文件(每行含custom_id/method/url/body)、API密钥、完成窗口参数(24h或1h)
输出批处理作业ID、输出文件ID(可下载results.jsonl)、错误文件ID(如有)、请求完成统计
适用人群需批量调用大模型API的开发者、数据标注团队、成本敏感型企业用户
不包含实时流式输出、自动失败重试机制、Web界面监控工具、非OpenAI兼容的其他端点

 

风险提示

  • 批处理作业一旦提交无法修改,请在上传前验证 JSONL 文件格式正确性
  • 24 小时窗口虽成本更低,但若作业失败或超时,重新提交将产生额外费用
  • 部分结果可能提前可用(X-Incomplete: true),但依赖此特性可能导致数据不完整
  • 单个文件 200MB 限制,超大批量需拆分为多个文件分别处理
  • API 密钥泄露将导致账户被滥用,建议配置环境变量而非硬编码

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/pjb157/doubleword-api/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...