表格处理助手表格处理助手
表格处理助手

技能简介

Sheetsmith 是一个基于 pandas 的轻量级封装工具,用于在命令行中快速处理 CSV、TSV 和 Excel 文件。它提供统一的接口完成数据预览、统计摘要、过滤查询、列变换和格式转换,无需重复编写 pandas 代码。

能做什么

  • 查看表格结构概览:行列数、数据类型分布、缺失值情况
  • 生成数值统计:均值、分位数、频次等描述性指标
  • 按条件过滤数据并导出结果
  • 新增计算列、重命名或删除字段
  • 在 CSV、TSV、Excel 格式之间互转

使用说明

  1. 将待处理的表格文件放入工作目录,或记录其完整路径
  2. 执行安装命令:pip install pandas openpyxl xlrd tabulate
  3. 运行基础命令格式:python3 skills/sheetsmith/scripts/sheetsmith.py <command> <filepath>
  4. 常用命令示例:
    • 查看摘要:python3 skills/sheetsmith/scripts/sheetsmith.py summary data.csv --rows 10
    • 过滤数据:python3 skills/sheetsmith/scripts/sheetsmith.py filter data.csv --query "age > 18" --output filtered.csv
    • 格式转换:python3 skills/sheetsmith/scripts/sheetsmith.py convert data.xlsx --output data.csv
  5. 修改数据时建议用 --output 指定新文件,确认无误后再用 --inplace 覆盖原文件

输入与输出

见下方输入与输出表格。

项目内容
输入CSV、TSV、XLS、XLSX 文件;pandas 查询字符串;列变换表达式;–rows/–tail 等控制参数
输出控制台表格预览、统计摘要、过滤或转换后的新文件(支持 CSV/TSV/XLSX)
适用人群数据分析师、开发人员、需快速处理表格但不愿重复编写 pandas 代码的用户
不包含图表可视化、数据库连接、多表 JOIN、定时自动化任务

 

风险提示

  • --inplace 会直接覆盖原文件,操作前请备份重要数据
  • 复杂 pandas 表达式需确保语法正确,错误表达式可能导致空结果或报错
  • 大文件处理可能消耗较多内存,建议先使用 previewsample 参数测试
  • Excel 文件依赖 openpyxl/xlrd,若未安装会提示缺失依赖

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/crimsondevil333333/sheetsmith/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...