社媒数据分析师
社交媒体投放效果分析
DuckDB CLI Specialist 是一款嵌入式分析型数据库的命令行工具,支持直接用 SQL 查询 CSV、Parquet、JSON 等文件,无需导入即可分析,也可进行多格式数据转换。
安装 DuckDB CLI:
# macOS
brew install duckdb
# Linux (Ubuntu/Debian)
wget https://github.com/duckdb/duckdb/releases/download/v1.0.0/duckdb_cli-linux-amd64.zip
unzip duckdb_cli-linux-amd64.zip
sudo mv duckdb /usr/local/bin/
# 验证安装
duckdb --version
基础查询:
# 查询 CSV 前10行
duckdb -c "SELECT * FROM 'data.csv' LIMIT 10"
# 查询 Parquet 文件
duckdb -c "SELECT * FROM 'data.parquet'"
# 批量读取多个文件
duckdb -c "SELECT * FROM read_parquet('logs/*.parquet')"
格式转换:
# CSV 转 Parquet
duckdb -c "COPY (SELECT * FROM 'input.csv') TO 'output.parquet' (FORMAT PARQUET)"
# Parquet 转 CSV(带表头)
duckdb -c "COPY (SELECT * FROM 'input.parquet') TO 'output.csv' (HEADER, DELIMITER ',')"
# JSON 转 Parquet
duckdb -c "COPY (SELECT * FROM read_json_auto('input.json')) TO 'output.parquet' (FORMAT PARQUET)"
打开持久化数据库:
# 创建或打开数据库
duckdb my_database.duckdb
# 只读模式打开
duckdb -readonly existing.duckdb
常用点命令(交互模式下):
.tables # 查看所有表
.schema [table “” not found /]
# 查看表结构
.mode markdown # 切换输出格式为 Markdown
.output file.txt # 将输出保存到文件
.timer on # 显示执行时间
指定输出格式:
duckdb -csv -c "SELECT * FROM 'data.csv'" # CSV 格式
duckdb -json -c "SELECT * FROM 'data.csv'" # JSON 数组
duckdb -markdown -c "SELECT * FROM 'data.csv'" # Markdown 表格
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 本地或远程 CSV、Parquet、JSON 文件;SQL 查询语句;命令行参数与配置选项 |
| 输出 | 查询结果(支持 csv/json/markdown/html/latex 等 18 种格式)、转换后的数据文件、数据库元数据 |
| 适用人群 | 数据分析师、数据工程师、后端开发、金融研究人员、需命令行快速处理数据的工程师 |
| 不包含 | 分布式计算能力、可视化图表生成、Web 管理界面、云端同步服务、企业级权限控制 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/camelsprout/duckdb-cli-ai-skills/SKILL.md
来源类型:GitHub 开源技能文档