LaminDB生物数据管理
技能简介LaminDB专为生命科学设计的数据湖仓框架。本技能...
系统掌握Apache Spark生产环境优化技巧,包括数据分区设计、RDD缓存策略、Shuffle参数调优及内存管理。帮助诊断慢作业根因,实现数据处理管道的高效扩展。
spark-optimization
见下方输入与输出表格。
| 输入 | 输出 |
|---|---|
| 任务目标、输入资料和约束条件;需要处理的平台或对象;结果格式要求 | 结构化结果;执行建议或可交付产物;便于复核的后续说明 |
原始链接:https://github.com/wshobson/agents
来源类型:GitHub 开源仓库