内容审核服务

2小时前更新 2 00
内容审核服务内容审核服务
内容审核服务

技能简介

基于Vettly内容审核API的多模态内容安全检查服务,支持对文本、图片和视频进行自动化安全评估。通过MCP服务器接入,提供可配置的审核策略与可追溯的决策记录。

能做什么

  • 检测用户生成内容中的违规信息(毒性、垃圾信息等)
  • 验证审核策略YAML配置的正确性
  • 查询账户下的可用审核策略列表
  • 获取近期审核决策记录与统计数据
  • 监控审核成本与调用量

使用说明

安装步骤:

  1. 访问 vettly.dev 注册并获取API密钥
  2. 将以下配置添加到MCP服务器设置中:
    {"mcpServers":{"vettly":{"command":"npx","args":["-y","@vettly/mcp"],"env":{"VETTLY_API_KEY":"your-api-key"}}}}

基本用法:

  • 首次使用先调用 list_policies 获取可用策略ID
  • 使用 moderate_content 提交内容审核请求
  • 图片/视频需传入URL地址,不支持原始二进制数据

输入与输出

见下方输入与输出表格。

项目内容
输入待审核内容(文本字符串或图片/视频URL)、策略ID、内容类型(可选)
输出安全评估分数、执行动作、提供商信息、延迟、成本
适用人群社区运营人员、内容平台开发者、产品经理、安全合规团队
不包含二进制文件直接处理、人工审核工作流、自定义模型训练、实时流式审核

 

风险提示

  • 需要有效的VETTLY_API_KEY环境变量,密钥泄露可能导致账户被盗用
  • 审核结果依赖第三方AI模型,存在误判可能,建议人工复核关键决策
  • 图片/视频审核按调用计费,高频使用需关注成本
  • 策略配置错误可能导致内容漏检或过度拦截

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/code-with-brian/content-moderation/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...