AI视频生成

3小时前更新 1 00

文本一键生成完整视频

收录时间：

2026-02-26

手机查看

AI视频生成

技能简介

端到端AI视频生成工具，支持从文本描述直接输出完整视频。整合图像生成（DALL-E 3、Stable Diffusion、Flux）、视频合成（LumaAI、Runway、Replicate）、语音旁白（OpenAI TTS、ElevenLabs）及FFmpeg后期剪辑，提供预算模式与质量模式两种工作流。

能做什么

文本转视频：输入描述自动生成含画面、配音的完整视频
图片序列转视频：将多张静态图合成为动态视频
多场景串联：按场景列表批量生成并拼接为长视频
后期配音：为已有视频添加AI合成旁白
视频特效：通过FFmpeg添加转场、叠加层等效果

使用说明

步骤1：安装依赖

pip install openai requests pillow replicate python-dotenv

FFmpeg已通过winget预装。

步骤2：配置API密钥

创建.env文件，按需填写以下至少一组：

# 图像生成（选其一）
OPENAI_API_KEY=sk-...              # DALL-E 3
REPLICATE_API_TOKEN=r8_...         # Stable Diffusion/Flux

# 视频生成（选其一）
LUMAAI_API_KEY=luma_...           # LumaAI
RUNWAY_API_KEY=...                # Runway ML

# 语音（可选）
ELEVENLABS_API_KEY=...

步骤3：执行生成

# 完整流程：文本→视频
python skills/ai-video-gen/generate_video.py \
  --prompt "未来城市夜景，飞行汽车穿梭" \
  --duration 5 \
  --voiceover "欢迎来到未来" \
  --output future.mp4

# 多场景视频
python skills/ai-video-gen/multi_scene.py \
  --scenes "日出" "繁忙街道" "宁静夜晚" \
  --duration 3 \
  --output day.mp4

输入与输出

见下方输入与输出表格。

项目	内容
输入	文本提示词、场景列表、图片路径、时长参数、配音文本、输出文件名
输出	MP4视频文件，含可选的中间帧序列与音频文件
适用人群	内容创作者、营销团队、独立开发者、教育工作者
不包含	视频上传分发、版权音乐库、协作审阅系统、实时流媒体

风险提示

API调用产生费用，DALL-E 3约$0.04-0.08/张，Runway约$0.05/秒
免费额度有限，LumaAI免费 tier 有生成次数限制
商用需注意各平台内容政策与版权归属
本地运行依赖GPU性能，复杂场景耗时较长

来源信息

原始链接：https://github.com/openclaw/skills/tree/main/skills/rhanbourinajd/ai-video-gen/SKILL.md
来源类型：GitHub仓库

数据统计

暂无评论

暂无评论...

AI视频生成

技能简介

能做什么

使用说明

输入与输出

风险提示

来源信息

数据统计

相关导航

SEO关键词研究

CAPTCHAS验证集成

WHOOP晨间报告

easyVerein API接入

RescueTime数据获取

飞书任务管理

POLT协作平台连接

航班实时追踪

暂无评论

标签云