通用 RPI
通用 RPI

适合:要做海报、封面、配图或视觉草图的人、要先生成一版图片结果再继续细修风格的人、要批量准备营销素材、内容配图或视觉参考的人。
多模态图像处理技能,支持文生图、图生图、图生文、长图拼接。当用户提到图片、图像、生成图、信息图、OCR 等关键词时触发。
| 能力 | 说明 | 脚本 | |—–|——|——| | 文生图 | 根据中文文本描述生成图片 | scripts/text_to_image.py | | 图生图 | 在已有图片基础上进行编辑 | scripts/image_to_image.py | | 图生文 | 分析图片内容(描述、OCR、图表等) | scripts/image_to_text.py | | 长图拼接 | 将多张图片垂直拼接为微信长图 | scripts/merge_long_image.py | | 调研配图 | 预设手绘风格的调研报告信息图 | scripts/research_image.py |。
当团队需要多模态图像处理技能时,可以先用图像处理技能完成第一轮处理。常见做法是把相关文件、网址、素材或配置交给它,先产出初版结果,再由人工确认和继续推进。
适合:OpenClaw、Codex、Kimiclaw、Windsurf、Trae、华为 CodeArts。
直接对 OpenClaw 说:
帮我安装一个叫 图像处理技能 的 Skill。
如果安装时需要精确名字,就用 opencode-skills-image-service。
装好以后,先用它帮我处理一遍当前任务。
如果需要手动安装,可以用这条命令:
clawhub install opencode-skills-image-service
适合:腾讯Workbuddy、百度Duclaw、字节Arkclaw、智谱Autoclaw、科大讯飞Astronclaw。
SKILL.md 或同名 .md 文件。用刚刚导入的图像处理技能,先帮我处理当前任务。
备注:这一种本质上是导入一个 Markdown 文件,给知道安装包里有 .md 文件的人即可。
适合:Claude Code、Cursor、通义灵码、文心快码。
最短可用命令:
python .opencode/skills/image-service/scripts/image_to_text.py image.jpg -m describe
如果要继续执行,可以再用:
python .opencode/skills/image-service/scripts/image_to_text.py screenshot.png -m ocr
python .opencode/skills/image-service/scripts/image_to_image.py input.png "编辑描述" -r 3:4