本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑此文档由 AI 生成。如发现任何错误或有改进建议,欢迎随时贡献!在 GitHub 上编辑 HunyuanImageToVideo 节点使用 Hunyuan 视频模型将图像转换为视频潜在表示。它接收条件化输入和可选的起始图像,生成可供视频生成模型进一步处理的视频潜在变量。该节点支持不同的引导类型,用于控制起始图像对视频生成过程的影响。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
正向 | CONDITIONING | 是 | - | 用于引导视频生成的正面条件化输入 |
vae | VAE | 是 | - | 用于将图像编码到潜在空间的 VAE 模型 |
宽度 | INT | 是 | 16 至 MAX_RESOLUTION | 输出视频的宽度(像素)(默认值:848,步长:16) |
高度 | INT | 是 | 16 至 MAX_RESOLUTION | 输出视频的高度(像素)(默认值:480,步长:16) |
长度 | INT | 是 | 1 至 MAX_RESOLUTION | 输出视频的帧数(默认值:53,步长:4) |
批量大小 | INT | 是 | 1 至 4096 | 同时生成的视频数量(默认值:1) |
指导类型 | COMBO | 是 | ”v1 (concat)" "v2 (replace)" "custom” | 将起始图像融入视频生成的方法(默认值:“v1 (concat)“) |
起始图像 | IMAGE | 否 | - | 用于初始化视频生成的可选起始图像 |
start_image 时,节点会根据所选的 guidance_type 使用不同的引导方法:
- “v1 (concat)“:将图像潜在变量与视频潜在变量拼接,并应用遮罩将图像融合到视频中
- “v2 (replace)“:用图像潜在变量替换初始视频帧,并应用噪声遮罩
- “custom”:将图像用作引导的参考潜在变量
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
Latent | CONDITIONING | 当提供 start_image 时,应用了图像引导的修改后正面条件化输入 |
latent | LATENT | 可供视频生成模型进一步处理的视频潜在表示 |
Source fingerprint (SHA-256):
e55e935b7955b28b04014359c544a230c51ee91e21170be1ae4f50705d3e7bba