AI视频生成

3小时前更新 1 00
AI视频生成AI视频生成
AI视频生成

技能简介

端到端AI视频生成工具,支持从文本描述直接输出完整视频。整合图像生成(DALL-E 3、Stable Diffusion、Flux)、视频合成(LumaAI、Runway、Replicate)、语音旁白(OpenAI TTS、ElevenLabs)及FFmpeg后期剪辑,提供预算模式与质量模式两种工作流。

能做什么

  • 文本转视频:输入描述自动生成含画面、配音的完整视频
  • 图片序列转视频:将多张静态图合成为动态视频
  • 多场景串联:按场景列表批量生成并拼接为长视频
  • 后期配音:为已有视频添加AI合成旁白
  • 视频特效:通过FFmpeg添加转场、叠加层等效果

使用说明

步骤1:安装依赖

pip install openai requests pillow replicate python-dotenv

FFmpeg已通过winget预装。

步骤2:配置API密钥

创建.env文件,按需填写以下至少一组:

# 图像生成(选其一)
OPENAI_API_KEY=sk-...              # DALL-E 3
REPLICATE_API_TOKEN=r8_...         # Stable Diffusion/Flux

# 视频生成(选其一)
LUMAAI_API_KEY=luma_...           # LumaAI
RUNWAY_API_KEY=...                # Runway ML

# 语音(可选)
ELEVENLABS_API_KEY=...

步骤3:执行生成

# 完整流程:文本→视频
python skills/ai-video-gen/generate_video.py \
  --prompt "未来城市夜景,飞行汽车穿梭" \
  --duration 5 \
  --voiceover "欢迎来到未来" \
  --output future.mp4

# 多场景视频
python skills/ai-video-gen/multi_scene.py \
  --scenes "日出" "繁忙街道" "宁静夜晚" \
  --duration 3 \
  --output day.mp4

输入与输出

见下方输入与输出表格。

项目内容
输入文本提示词、场景列表、图片路径、时长参数、配音文本、输出文件名
输出MP4视频文件,含可选的中间帧序列与音频文件
适用人群内容创作者、营销团队、独立开发者、教育工作者
不包含视频上传分发、版权音乐库、协作审阅系统、实时流媒体

 

风险提示

  • API调用产生费用,DALL-E 3约$0.04-0.08/张,Runway约$0.05/秒
  • 免费额度有限,LumaAI免费 tier 有生成次数限制
  • 商用需注意各平台内容政策与版权归属
  • 本地运行依赖GPU性能,复杂场景耗时较长

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/rhanbourinajd/ai-video-gen/SKILL.md
来源类型:GitHub仓库

数据统计

相关导航

暂无评论

none
暂无评论...