本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑Kandinsky5ImageToVideo 节点用于准备 Kandinsky 模型视频生成所需的 conditioning 和潜在空间数据。它会创建一个空的视频潜在张量,并可选择对起始图像进行编码,以引导生成视频的初始帧,同时相应地修改正向和负向 conditioning。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
正面条件 | CONDITIONING | 是 | 不适用 | 引导视频生成的正向 conditioning 提示。 |
负面条件 | CONDITIONING | 是 | 不适用 | 引导视频生成避开特定概念的正向 conditioning 提示。 |
vae | VAE | 是 | 不适用 | 用于将可选的起始图像编码到潜在空间的 VAE 模型。 |
宽度 | INT | 否 | 16 至 8192(步长 16) | 输出视频的宽度(像素),默认值:768。 |
高度 | INT | 否 | 16 至 8192(步长 16) | 输出视频的高度(像素),默认值:512。 |
时长 | INT | 否 | 1 至 8192(步长 4) | 视频的帧数,默认值:121。 |
批次大小 | INT | 否 | 1 至 4096 | 同时生成的视频序列数量,默认值:1。 |
初始图象 | IMAGE | 否 | 不适用 | 可选的起始图像。如果提供,该图像将被编码,并用于替换模型输出潜在变量中的噪声起始部分。 |
start_image 时,它会自动通过双线性插值调整大小,以匹配指定的 width 和 height。图像批次中的前 length 帧将用于编码。编码后的潜在变量随后会被注入到 positive 和 negative conditioning 中,以引导视频的初始外观。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
负面条件 | CONDITIONING | 修改后的正向 conditioning,可能已更新编码后的起始图像数据。 |
Latent | CONDITIONING | 修改后的负向 conditioning,可能已更新编码后的起始图像数据。 |
条件Latent | LATENT | 一个填充为零的空视频潜在张量,其形状符合指定的尺寸。 |
cond_latent | LATENT | 所提供的起始图像的干净、编码后的潜在表示。内部使用此数据来替换生成视频潜在变量中带噪声的起始部分。 |
Source fingerprint (SHA-256):
19d3b60be18f5adcd659563329988bce2511a1b27b33fd0ab3a9d93e265557f2