AI图像生成

1小时前更新 1 00
AI图像生成AI图像生成
AI图像生成

技能简介

Image Cog 是基于 CellCog SDK 的 AI 图像生成工具,支持从文本描述创建单图、编辑现有图片、保持角色一致性、制作产品摄影风格图片、基于参考图生成以及批量产出系列图片。

业务背景

Image Cog 让营销、设计和内容团队摆脱专业设计软件门槛,通过文字描述快速产出高质量视觉素材。支持单图创作、批量系列生成及风格迁移,大幅降低图片制作周期与外包成本,同时保持品牌角色一致性,加速创意落地。

落地案例:某电商运营团队需为新品上线制作主视觉图。运营人员在聊天窗口输入"极简白色背景,无线耳机悬浮展示,柔和侧光",选择产品摄影风格,10分钟后获得可直接上架的PNG素材。后续又上传参考图批量生成多角度场景图,3天内完成全店视觉更新,无需设计师介入。

能做什么

  • 根据文字描述生成场景、人像、产品、抽象艺术、自然风景等单张图片
  • 对现有图片进行风格迁移、背景移除、色彩增强、元素修改
  • 创建同一角色在不同场景下的系列图片,适用于漫画、营销素材、品牌吉祥物
  • 输出专业产品摄影风格图片,包括主视觉图、生活场景图、平铺图、多角度展示
  • 基于参考图片匹配风格、保持角色一致性或复刻构图
  • 批量生成社交媒体套图、网站头图、广告变体、博客插图等关联图片组

使用说明

前置依赖安装:

clawhub install cellcog

需先阅读 cellcog 技能文档完成 SDK 配置。本技能展示具体应用场景。

快速调用方式(v1.0+):

# 异步调用,立即返回
result = client.create_chat(
    prompt="[你的图像需求描述]",
    notify_session_key="agent:main:main",
    task_label="image-task",
    chat_mode="agent"  # 简单图片用 "agent",复杂需求用 "agent team"
)
# 通过 Daemon 接收完成通知,无需轮询

图片规格选择:

  • 比例:1:1、16:9、9:16、4:3、3:4、3:2、2:3、21:9
  • 尺寸:1K(约1024px)、2K(约2048px)、4K(约4096px)
  • 风格:写实照片、插画、水彩、油画、动漫、数字艺术、矢量
  • 格式:PNG(默认)

建议:1K 用于快速迭代和草稿;2K 用于标准网页内容和演示;4K 用于印刷级成品。

模式选择:复杂场景、角色系列、参考图生成、批量图片组建议使用 chat_mode="agent team";简单单图可用 "agent" 提速。

输入与输出

见下方输入与输出表格。

项目内容
输入文本提示词、图片规格(比例/尺寸/风格)、参考图片(可选)、聊天模式、任务标签与通知密钥
输出PNG 格式生成图片、异步任务完成通知
适用人群设计师、营销人员、产品经理、开发者、内容创作者
不包含视频生成、实时图像流、本地模型推理、自动版权审查

 

风险提示

  • 依赖 cellcog SDK,未安装前置技能将导致调用失败
  • API 调用为异步模式,需配置 Daemon 通知机制获取结果,不可同步轮询
  • 4K 图片生成耗时较长,大流量场景需评估成本
  • 角色一致性在多批次生成中可能存在细微差异,关键项目建议人工校验
  • 参考图生成涉及版权素材时需注意合规风险

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/nitishgargiitd/image-cog/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...