鲁班CLI工具

21分钟前更新 1 00
鲁班CLI工具鲁班CLI工具
鲁班CLI工具

技能简介

鲁班CLI(Luban CLI)是面向MLOps场景的专用命令行工具,用于统一管理机器学习实验环境、训练任务和在线推理服务的全生命周期。

业务背景

鲁班CLI工具为算法团队提供统一的MLOps命令行入口,解决机器学习全流程中环境搭建、训练调度和模型部署的碎片化问题。通过单一工具即可完成实验环境管理、分布式训练资源分配及在线推理服务的弹性扩缩容,降低多平台切换成本,提升模型迭代效率。

落地案例:某算法工程师启动新实验时,先执行luban env create配置带GPU驱动的开发镜像;随后用luban train submit提交分布式训练任务,指定4块GPU并行计算;模型验证通过后,运行luban serve deploy发布在线推理服务,并根据业务流量高峰通过luban serve scale动态调整副本数,实现从研发到生产的无缝衔接。

能做什么

  • 创建和管理开发实验环境,支持自定义镜像配置
  • 提交和监控分布式模型训练任务,分配GPU等资源
  • 部署弹性伸缩的在线推理服务,调整副本数量
  • 实现环境、任务、服务三类实体的增删改查操作

使用说明

本技能为开发框架类工具,需结合项目模板使用:

  1. 获取CLI基础结构:参考 templates/cli_boilerplate.py 中的argparse脚手架代码
  2. 查阅规范文档:阅读 references/mlops_guide.md 了解实体属性与命令设计标准
  3. 安装依赖:根据模板要求配置Python运行环境及argparse等依赖库
  4. 扩展命令:按env/job/svc三类实体实现CRUD接口

输入与输出

见下方输入与输出表格。

项目内容
输入环境名称、镜像版本、训练脚本路径、GPU数量、模型路径、服务副本数、任务/服务ID等参数
输出环境列表、任务状态、服务部署信息、资源配置详情、操作执行结果
适用人群MLOps工程师、算法工程师、平台开发人员、DevOps人员
不包含底层Kubernetes直接操作、模型训练代码编写、业务指标监控系统、多租户权限管理

 

风险提示

  • 删除操作会清理资源且不可恢复,执行前需确认依赖关系
  • 服务扩缩容可能影响线上流量,建议在低峰期操作
  • 训练任务资源分配不当可能导致集群资源耗尽

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/guunergooner/luban-cli/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...