本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑Wan22ImageToVideoLatent 节点可从图像创建视频潜在表示。它会生成具有指定维度的空白视频潜在空间,并可选择将起始图像序列编码到初始帧中。当提供起始图像时,该节点会将图像编码到潜在空间,并为修复区域生成相应的噪声遮罩。
输入
| 参数 | 数据类型 | 是否必需 | 范围 | 描述 |
|---|---|---|---|---|
VAE | VAE | 是 | - | 用于将图像编码到潜在空间的 VAE 模型 |
宽度 | INT | 是 | 32 至 MAX_RESOLUTION | 输出视频的像素宽度(默认值:1280,步长:32) |
高度 | INT | 是 | 32 至 MAX_RESOLUTION | 输出视频的像素高度(默认值:704,步长:32) |
长度 | INT | 是 | 1 至 MAX_RESOLUTION | 视频序列中的帧数(默认值:49,步长:4) |
批次大小 | INT | 是 | 1 至 4096 | 生成的批次数量(默认值:1) |
起始图像 | IMAGE | 否 | - | 可选的起始图像序列,用于编码到视频潜在空间中 |
start_image 时,节点会将图像序列编码到潜在空间的起始帧中,并生成相应的噪声遮罩。宽度和高度参数必须能被 16 整除,以确保潜在空间维度正确。length 参数决定视频潜在空间中的帧数;潜在空间的时间维度计算公式为 ((length - 1) // 4) + 1。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
samples | LATENT | 生成的视频潜在表示 |
noise_mask | LATENT | 噪声遮罩,指示生成过程中应去噪的区域 |
Source fingerprint (SHA-256):
0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c