图像智能分析

1小时前更新 2 00

调用Google V

收录时间：

2026-02-26

图像智能分析

该技能集成 Google Cloud Vision API，可对本地或网络图像执行标签检测与光学字符识别（OCR），适用于金融票据、合同扫描件等场景的快速信息提取。

图像智能分析帮助业务人员快速从图片中获取关键信息。上传金融票据、合同扫描件等文件，系统自动识别图中物体场景并提取文字内容，省去人工录入和核对时间，提升文档处理效率。

落地案例：财务人员收到供应商发来的纸质发票照片，使用该技能上传图片后，系统自动识别发票中的金额、日期、税号等关键字段并转为可编辑文本，无需手工录入系统，大幅减少票据处理时间，降低人为输错风险。

确保已配置 Google Cloud 项目并启用 Vision API
设置环境变量 GOOGLE_APPLICATION_CREDENTIALS 指向服务账号密钥文件
安装依赖：pip install google-cloud-vision
执行命令：vision_analyze /path/to/image.png 或 vision_analyze https://example.com/image.jpg

见下方输入与输出表格。

原始链接：https://github.com/openclaw/skills/tree/main/skills/humberto0o0/vision-analyze/SKILL.md
来源类型：GitHub 开源仓库

数据统计

暂无评论...