HunyuanImageToVideo - ComfyUI Built-in Node Documentation

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

此文档由 AI 生成。如发现任何错误或有改进建议，欢迎随时贡献！在 GitHub 上编辑 HunyuanImageToVideo 节点使用 Hunyuan 视频模型将图像转换为视频潜在表示。它接收条件化输入和可选的起始图像，生成可供视频生成模型进一步处理的视频潜在变量。该节点支持不同的引导类型，用于控制起始图像对视频生成过程的影响。

输入

参数	数据类型	是否必填	范围	描述
`正向`	CONDITIONING	是	-	用于引导视频生成的正面条件化输入
`vae`	VAE	是	-	用于将图像编码到潜在空间的 VAE 模型
`宽度`	INT	是	16 至 MAX_RESOLUTION	输出视频的宽度（像素）（默认值：848，步长：16）
`高度`	INT	是	16 至 MAX_RESOLUTION	输出视频的高度（像素）（默认值：480，步长：16）
`长度`	INT	是	1 至 MAX_RESOLUTION	输出视频的帧数（默认值：53，步长：4）
`批量大小`	INT	是	1 至 4096	同时生成的视频数量（默认值：1）
`指导类型`	COMBO	是	”v1 (concat)" "v2 (replace)" "custom”	将起始图像融入视频生成的方法（默认值：“v1 (concat)“）
`起始图像`	IMAGE	否	-	用于初始化视频生成的可选起始图像

注意： 当提供 start_image 时，节点会根据所选的 guidance_type 使用不同的引导方法：

“v1 (concat)“：将图像潜在变量与视频潜在变量拼接，并应用遮罩将图像融合到视频中
“v2 (replace)“：用图像潜在变量替换初始视频帧，并应用噪声遮罩
“custom”：将图像用作引导的参考潜在变量

输出

输出名称	数据类型	描述
`Latent`	CONDITIONING	当提供 start_image 时，应用了图像引导的修改后正面条件化输入
`latent`	LATENT	可供视频生成模型进一步处理的视频潜在表示

Source fingerprint (SHA-256): e55e935b7955b28b04014359c544a230c51ee91e21170be1ae4f50705d3e7bba

GetICLoRAParameters - ComfyUI Built-in Node Documentation

HunyuanRefinerLatent - ComfyUI Built-in Node Documentation

​输入

​输出

输入

输出