图片文字提取

4小时前更新 1 00

从图像中提取文字内容

收录时间：

2026-02-26

PDF与文档处理 # OCR识别 # 图像处理 # 多语言支持

图片文字提取

图片文字提取

技能简介

该技能基于Tesseract OCR引擎，从PNG、JPEG、TIFF、BMP等格式的图像文件中提取可编辑的文字内容，支持多语言识别。

能做什么

将截图、扫描件转换为可复制的文字
提取照片中的文档内容
识别多种语言的印刷体文字
批量处理图像文件进行文字归档

使用说明

安装步骤：

执行安装命令：sudo dnf install tesseract
确认tesseract已加入系统PATH

使用方法：

基础识别（默认英文）：image-ocr "screenshot.png"
指定语言识别：image-ocr "document.jpg" --lang eng

输入与输出

见下方输入与输出表格。

项目	内容
输入	图像文件路径（支持PNG、JPEG、TIFF、BMP格式）；可选语言参数
输出	图像中包含的纯文本字符串
适用人群	办公文档处理人员、研究人员、需要数字化纸质资料的用户
不包含	PDF文件直接解析、版面布局分析、手写草书识别、自动图像增强

风险提示

手写体识别准确率较低
复杂背景或低分辨率图像可能影响识别效果
需确保图像文件路径正确且格式受支持
多语言混合文档建议分语言多次识别

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/xejrax/image-ocr/SKILL.md
来源类型：GitHub仓库

数据统计

相关导航

DXF图纸生成

从JSON生成制造级

界面设计规范

现代UI/UX设计原

网站风格指南生成器

自动生成专业设计规范

文档解析提取

多格式文档结构化提取

房产评估报告起草

自动生成带修订标记的

外部文本安全扫描

检测提示注入攻击

邮件订机票助手

邮件一句话订改退机票

Straker翻译验证

AI翻译与人审服务

暂无评论

none

暂无评论...