本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑CosmosImageToVideoLatent 节点从输入图像创建视频潜在表示。它会生成一个空白视频潜在表示,并可选择将起始和/或结束图像编码到视频序列的起始和/或结束帧中。当提供图像时,它还会创建相应的噪声掩码,以指示在生成过程中应保留潜在表示的哪些部分。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
vae | VAE | 是 | - | 用于将图像编码到潜在空间的 VAE 模型 |
宽度 | INT | 是 | 16 至 MAX_RESOLUTION | 输出视频的宽度(像素),默认值:1280 |
高度 | INT | 是 | 16 至 MAX_RESOLUTION | 输出视频的高度(像素),默认值:704 |
长度 | INT | 是 | 1 至 MAX_RESOLUTION | 视频序列中的帧数,默认值:121 |
批量大小 | INT | 是 | 1 至 4096 | 要生成的潜在批次数量,默认值:1 |
开始图像 | IMAGE | 否 | - | 可选,编码到视频序列起始位置的图像 |
结束图像 | IMAGE | 否 | - | 可选,编码到视频序列结束位置的图像 |
start_image 也不提供 end_image 时,节点会返回一个空白潜在表示,不带任何噪声掩码。当提供任一图像时,潜在表示的相应部分会被编码并相应地添加掩码。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
latent | LATENT | 生成的视频潜在表示,包含可选的编码图像及相应的噪声掩码 |
Source fingerprint (SHA-256):
31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d