本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑HunyuanVideo15ImageToVideo 节点基于 HunyuanVideo 1.5 模型,为视频生成准备条件嵌入和潜在空间数据。它会为视频序列创建一个初始潜在表示,并可选择性地集成起始图像或 CLIP 视觉输出,以引导生成过程。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
正面条件 | CONDITIONING | 是 | - | 正向条件提示,描述视频应包含的内容。 |
负面条件 | CONDITIONING | 是 | - | 负向条件提示,描述视频应避免的内容。 |
vae | VAE | 是 | - | 用于将起始图像编码到潜在空间的 VAE(变分自编码器)模型。 |
宽度 | INT | 否 | 16 到 MAX_RESOLUTION | 输出视频帧的宽度(像素)。必须能被 16 整除。(默认值:848) |
高度 | INT | 否 | 16 到 MAX_RESOLUTION | 输出视频帧的高度(像素)。必须能被 16 整除。(默认值:480) |
帧数 | INT | 否 | 1 到 MAX_RESOLUTION | 视频序列的总帧数。必须是 4 的倍数。(默认值:33) |
批次大小 | INT | 否 | 1 到 4096 | 单批次生成的视频序列数量。(默认值:1) |
图像 | IMAGE | 否 | - | 可选的起始图像,用于初始化视频生成。如果提供,它将被编码并用于约束前几帧。仅使用图像的前 帧数 帧。 |
CLIP视觉输出 | CLIP_VISION_OUTPUT | 否 | - | 可选的 CLIP 视觉嵌入,为生成过程提供额外的视觉条件。 |
start_image 时,它会使用双线性插值自动调整大小,以匹配指定的 width 和 height。将使用图像批次的前 length 帧。然后,编码后的图像会作为 concat_latent_image 连同对应的 concat_mask 添加到 positive 和 negative 条件中。对于起始图像覆盖的帧,掩码设置为 0.0;对于剩余帧,掩码设置为 1.0。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
负面条件 | CONDITIONING | 修改后的正向条件,现在可能包含编码后的起始图像或 CLIP 视觉输出。 |
latent | CONDITIONING | 修改后的负向条件,现在可能包含编码后的起始图像或 CLIP 视觉输出。 |
latent | LATENT | 一个空的潜在张量,其维度已根据指定的批次大小、视频长度、宽度和高度进行配置。 |
Source fingerprint (SHA-256):
2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47