本地音频转文字
Docker运行Wh
Loom Workflow Analyzer 是一款面向 Loom 录屏视频的 AI 原生流程分析工具。通过下载视频、智能抽帧、语音转写和多模态分析,将屏幕录制中的业务操作拆解为结构化的 Lobster 可执行工作流。
业务团队常用Loom录屏记录操作流程,但视频难以沉淀为可复用的标准作业程序。该工具将录屏自动转化为结构化工作流,识别操作步骤、所用工具及决策分叉点,让隐性的个人经验变成显性的团队资产,减少培训成本与执行偏差。
落地案例:某运营专员用Loom录制了"处理退款申请"的完整操作:登录后台、核对订单、判断退款类型、提交审批。工具解析视频后生成Lobster工作流文件,清晰列出每一步点击位置与分支条件,并标注"判断是否符合特殊退款政策"等需人工确认的环节。团队审核后即可上线运行,新人无需反复观看视频即可按标准流程操作。
安装依赖
# 需预先安装以下工具
yt-dlp # 视频下载
ffmpeg # 抽帧与场景检测
whisper # 语音转录
# 另需配置支持视觉的 LLM 用于分析步骤
完整流程
{baseDir}/scripts/loom-workflow analyze https://loom.com/share/abc123
分步执行
{baseDir}/scripts/loom-workflow download <url>{baseDir}/scripts/loom-workflow extract ./video.mp4output/workflow-analysis-prompt.md 与帧图片提交给视觉模型,保存 JSON 响应至 workflow-analysis.json{baseDir}/scripts/loom-workflow generate ./output/workflow-analysis.json见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | Loom 视频链接或本地 MP4 文件;视觉模型 API 访问权限 |
| 输出 | JSON 流程定义、Markdown 摘要、Lobster 可执行文件 |
| 适用人群 | 业务流程分析师、RPA 开发团队、需文档化操作手册的企业 |
| 不包含 | 内置视觉模型;Lobster 运行时环境;自动登录或凭证管理 |
approve 审批门,需人工确认破坏性/外部操作原始链接:https://github.com/openclaw/skills/tree/main/skills/g9pedro/loom-workflow/SKILL.md
来源类型:GitHub 仓库