DeepSpeed分布式训练

4天前更新 1 00

Expert guidance for distributed training with DeepSpeed - ZeRO optimization stages, pipeline parallelism, FP。

收录时间：

2026-03-06

下载 Markdown 文档

保存原始技能说明，便于离线查看、转存和审查。

下载 Markdown 文档

大模型工具 # 技能 # 效率 # 自动化

DeepSpeed分布式训练

DeepSpeed分布式训练

技能简介

DeepSpeed突破单卡显存限制，通过ZeRO分片技术将万亿参数模型训练成本降至可接受范围。

能做什么

整理模型调用与提示流程
沉淀可复用的智能体能力
输出可接入业务的执行方案

使用说明

明确模型目标与输入边界。
配置提示流程和调用参数。
检查输出质量并做人工复核。

英文名

deepspeed

输入与输出

见下方输入与输出表格。

输入	输出
任务目标、输入资料和约束条件；需要处理的平台或对象；结果格式要求	结构化结果；执行建议或可交付产物；便于复核的后续说明

风险提示

涉及外部平台接口、账号或权限时，先确认授权边界与数据访问范围。
自动生成或自动执行结果应保留人工复核，避免直接替代最终业务判断。
若处理内部资料、客户信息或经营数据，应先完成脱敏与权限控制。

来源信息

原始链接：https://github.com/Orchestra-Research/AI-Research-SKILLs
来源类型：GitHub 开源仓库

数据统计

相关导航

AI推特助手 · moltter

AI推特助手 · moltter

AI代理自动发推互动

Tushare行情接口

连接 zhewenzhang/tushare_MCP，用于投研数据获取、财报解读与研究流程加速。

Excel表格 · excel-to-json-mcp

Excel表格 · excel-to-json-mcp

连接 he-yang/excel-to-json-mcp，用于办公流程自动化、文档协同和团队执行提效。

AI智能体分类市场

AI代理交易市集

Jira任务 · jira-mcp-6

Jira任务 · jira-mcp-6

连接 tbreeding/jira-mcp，用于办公流程自动化、文档协同和团队执行提效。

macOS原生界面设计

下载 Markdown 文档保存原始技能说明，便于离线查看与...

文档处理 · python-architecture-review

文档处理 · python-architecture-review

下载 Markdown 文档保存原始技能说明，便于离线查看与...

CircleCI流水线自动化

下载 Markdown 文档保存原始技能说明，便于离线查看与...

暂无评论

none

暂无评论...