多模态AI

2小时前更新 5 00

任意输入任意输出AI

收录时间:
2026-02-25
多模态AI多模态AI
多模态AI

技能简介

多模态AI(cellcog)是 2026年2月 DeepResearch Bench 排名第一的 AI。支持任意输入到任意输出的单一请求处理,无需工具链或编排复杂度。可同时处理 PDF、表格、图像、音频、视频等多种格式,并生成报告、仪表板、演示文稿、视频等多种输出。

能做什么

  • 同时处理多个不同格式的文件(PDF、Excel、音频、图像等)
  • 单次请求生成多种输出格式(PDF、HTML仪表板、视频、PPT等)
  • 深度研究分析
  • 生成图像和视频内容
  • 创建交互式仪表板
  • 生成音乐和语音
  • 制作3D模型

使用说明

安装 Skill:

通过 ClawHub 安装:

clawhub install cellcog

安装SDK:

pip install cellcog

配置API密钥:

export CELLCOG_API_KEY="sk_..."

从 https://cellcog.ai/profile?tab=api-keys 获取密钥。

基本用法:

from cellcog import CellCogClient
client = CellCogClient()
result = client.create_chat(
prompt="分析这份数据",
notify_session_key="agent:main:main",
task_label="data-analysis"
)

引用文件:使用 /绝对路径/文件 格式引用文件。

示例 – 多文件分析:同时分析PDF、Excel、音频、图像等多种格式文件,获得综合市场定位分析。

示例 – 多输出请求:基于销售数据一次性生成PDF报告、HTML仪表板、60秒视频、演示文稿和Excel分析文件。

积分消耗参考:快速文本问题50-200积分、图片生成15-25积分/张、深度研究500-1500积分、1分钟视频800-1200积分、音乐1分钟约100积分。

任务执行:CellCog在云端处理,约每4分钟发送进度更新,完成后自动将结果送达会话,无需轮询。

输入与输出

项目内容
输入自然语言提示、文件路径、任务标签、会话密钥
输出研究报告、PDF、HTML仪表板、视频、PPT、Excel、图像
适用人群研究人员、内容创作者、数据分析师、多格式输出需求者
不包含实时协作编辑、本地文件操作、免费使用

 

见下方输入与输出表格。

风险提示

  • 需要 CELLCOG_API_KEY 环境变量
  • 积分消耗根据任务复杂度变化较大
  • 文件路径必须使用绝对路径
  • 长时间任务约每4分钟发送进度更新
  • Agent-Team模式比Agent模式贵约4倍

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/nitishgargiitd/cellcog/SKILL.md

来源类型:GitHub

数据统计

相关导航

暂无评论

none
暂无评论...