SEO关键词研究
DataForSEO
端到端AI视频生成工具,支持从文本描述直接输出完整视频。整合图像生成(DALL-E 3、Stable Diffusion、Flux)、视频合成(LumaAI、Runway、Replicate)、语音旁白(OpenAI TTS、ElevenLabs)及FFmpeg后期剪辑,提供预算模式与质量模式两种工作流。
步骤1:安装依赖
pip install openai requests pillow replicate python-dotenv
FFmpeg已通过winget预装。
步骤2:配置API密钥
创建.env文件,按需填写以下至少一组:
# 图像生成(选其一)
OPENAI_API_KEY=sk-... # DALL-E 3
REPLICATE_API_TOKEN=r8_... # Stable Diffusion/Flux
# 视频生成(选其一)
LUMAAI_API_KEY=luma_... # LumaAI
RUNWAY_API_KEY=... # Runway ML
# 语音(可选)
ELEVENLABS_API_KEY=...
步骤3:执行生成
# 完整流程:文本→视频
python skills/ai-video-gen/generate_video.py \
--prompt "未来城市夜景,飞行汽车穿梭" \
--duration 5 \
--voiceover "欢迎来到未来" \
--output future.mp4
# 多场景视频
python skills/ai-video-gen/multi_scene.py \
--scenes "日出" "繁忙街道" "宁静夜晚" \
--duration 3 \
--output day.mp4
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | 文本提示词、场景列表、图片路径、时长参数、配音文本、输出文件名 |
| 输出 | MP4视频文件,含可选的中间帧序列与音频文件 |
| 适用人群 | 内容创作者、营销团队、独立开发者、教育工作者 |
| 不包含 | 视频上传分发、版权音乐库、协作审阅系统、实时流媒体 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/rhanbourinajd/ai-video-gen/SKILL.md
来源类型:GitHub仓库