WanImageToVideo - ComfyUI Built-in Node Documentation - ComfyUI

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

WanImageToVideo 节点为视频生成任务准备条件化（conditioning）和潜在空间（latent）表示。它会为视频生成创建一个空的潜在空间，并可选择性地结合起始图像和 CLIP 视觉输出，以引导视频生成过程。该节点会根据提供的图像和视觉数据修改正向和负向条件化输入。

输入

参数	数据类型	是否必填	范围	描述
`正面`	CONDITIONING	是	-	用于引导生成过程的正向条件化输入
`负面`	CONDITIONING	是	-	用于引导生成过程的负向条件化输入
`vae`	VAE	是	-	用于将图像编码到潜在空间的 VAE 模型
`宽度`	INT	是	16 至 MAX_RESOLUTION	输出视频的宽度（默认值：832，步长：16）
`高度`	INT	是	16 至 MAX_RESOLUTION	输出视频的高度（默认值：480，步长：16）
`长度`	INT	是	1 至 MAX_RESOLUTION	视频的帧数（默认值：81，步长：4）
`批量大小`	INT	是	1 至 4096	每批生成的视频数量（默认值：1）
`clip视觉输出`	CLIP_VISION_OUTPUT	否	-	可选的 CLIP 视觉输出，用于额外的条件化
`开始图像`	IMAGE	否	-	可选的起始图像，用于初始化视频生成

注意： 当提供了 start_image 时，节点会对图像序列进行编码，并对条件化输入应用掩码。当提供了 clip_vision_output 参数时，它会向正向和负向输入添加基于视觉的条件化信息。

输出

输出名称	数据类型	描述
`负面`	CONDITIONING	已整合图像和视觉数据的修改后正向条件化
`潜在`	CONDITIONING	已整合图像和视觉数据的修改后负向条件化
`latent`	LATENT	可用于视频生成的空潜在空间张量

Source fingerprint (SHA-256): e9f4350c43e48351523c04d82675c24f868df7b2109530c32b8e752a3ab61e8b

WanHuMoImageToVideo - ComfyUI Built-in Node Documentation

WanInfiniteTalkToVideo - ComfyUI Built-in Node Documentation