图片文字提取

4小时前更新 1 00

从图像中提取文字内容

收录时间:
2026-02-26
图片文字提取图片文字提取
图片文字提取

技能简介

该技能基于Tesseract OCR引擎,从PNG、JPEG、TIFF、BMP等格式的图像文件中提取可编辑的文字内容,支持多语言识别。

能做什么

  • 将截图、扫描件转换为可复制的文字
  • 提取照片中的文档内容
  • 识别多种语言的印刷体文字
  • 批量处理图像文件进行文字归档

使用说明

安装步骤:

  1. 执行安装命令:sudo dnf install tesseract
  2. 确认tesseract已加入系统PATH

使用方法:

  1. 基础识别(默认英文):image-ocr "screenshot.png"
  2. 指定语言识别:image-ocr "document.jpg" --lang eng

输入与输出

见下方输入与输出表格。

项目内容
输入图像文件路径(支持PNG、JPEG、TIFF、BMP格式);可选语言参数
输出图像中包含的纯文本字符串
适用人群办公文档处理人员、研究人员、需要数字化纸质资料的用户
不包含PDF文件直接解析、版面布局分析、手写草书识别、自动图像增强

 

风险提示

  • 手写体识别准确率较低
  • 复杂背景或低分辨率图像可能影响识别效果
  • 需确保图像文件路径正确且格式受支持
  • 多语言混合文档建议分语言多次识别

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/xejrax/image-ocr/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...