灵活数据导入器
多格式数据自动入库工
该技能提供企业级数据科学能力,覆盖统计建模、实验设计、因果推断与高级分析。支持Python/R/SQL技术栈,包含特征工程流水线、模型评估套件及实验设计工具,适用于构建生产级预测系统与数据驱动决策场景。
步骤1:克隆仓库
git clone https://github.com/openclaw/skills.git
cd skills/alirezarezvani/senior-data-scientist
步骤2:安装依赖(需根据项目补充具体命令)
# 建议创建虚拟环境
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
pip install -r requirements.txt # 若存在
步骤3:运行核心工具
# 实验设计
python scripts/experiment_designer.py --input data/ --output results/
# 特征工程
python scripts/feature_engineering_pipeline.py --target project/ --analyze
# 模型评估
python scripts/model_evaluation_suite.py --config config.yaml --deploy
步骤4:参考文档
详细技术方案见 references/ 目录下的统计方法、实验框架与特征工程模式文档。
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 原始数据集、实验配置、业务假设、特征元数据 |
| 输出 | 模型文件、实验报告、特征评分、推理服务、监控配置 |
| 适用人群 | 数据分析师、产品增长团队、业务线工程师、MLOps负责人 |
| 不包含 | 基础设施运维、深度学习训练、法律咨询、编程教学 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/alirezarezvani/senior-data-scientist/SKILL.md
来源类型:GitHub开源技能库