多分支情景推演
技能简介针对开放性假设问题设计的严谨推演工具,将线性思考扩展...
PyTorch FSDP2是新一代全分片数据并行技术,通过更细粒度的张量分片降低显存占用。该技能指导在训练脚本中正确接入fully_shard API,优化大模型分布式训练配置,解决单卡显存不足导致的规模瓶颈。
pytorch-fsdp2
见下方输入与输出表格。
| 输入 | 输出 |
|---|---|
| 任务目标、输入资料和约束条件;需要处理的平台或对象;结果格式要求 | 结构化结果;执行建议或可交付产物;便于复核的后续说明 |
原始链接:https://github.com/Orchestra-Research/AI-Research-SKILLs
来源类型:GitHub 开源仓库