跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
此节点用于支持阿里巴巴万Fun Control视频生成模型,在此提交之后添加。
  • 目的: 使用Wan 2.1 Fun Control模型准备视频生成所需的调节信息。
WanFunControlToVideo节点是ComfyUI的一个扩展,旨在支持Wan Fun Control模型进行视频生成,目标是利用WanFun控制来创建视频。 该节点作为关键调节信息的准备点,并初始化潜在空间的中心点,使用Wan 2.1 Fun模型引导后续的视频生成过程。节点名称清晰地表明了其功能:它接受各种输入,并将其转换为适合在WanFun框架内控制视频生成的格式。 该节点在ComfyUI节点层级中的位置表明,它在视频生成流程的早期阶段运行,专注于在实际采样或解码视频帧之前处理调节信号。

输入

参数名是否必需数据类型描述默认值
正向CONDITIONING标准的ComfyUI正向调节数据,通常来自”CLIP Text Encode”节点。正向提示描述了用户期望生成视频的内容、主题和艺术风格。
负向CONDITIONING标准的ComfyUI负向调节数据,通常由”CLIP Text Encode”节点生成。负向提示指定了用户希望在生成视频中避免的元素、风格或伪影。
vaeVAE需要与Wan 2.1 Fun模型系列兼容的VAE(变分自编码器)模型,用于编码和解码图像/视频数据。
宽度INT输出视频帧的期望宽度(像素),默认值为832,最小值为16,最大值由nodes.MAX_RESOLUTION决定,步长为16。832
高度INT输出视频帧的期望高度(像素),默认值为480,最小值为16,最大值由nodes.MAX_RESOLUTION决定,步长为16。480
长度INT生成视频的总帧数,默认值为81,最小值为1,最大值由nodes.MAX_RESOLUTION决定,步长为4。81
批量大小INT单次批处理生成的视频数量,默认值为1,最小值为1,最大值为4096。1
CLIP视觉输出CLIP_VISION_OUTPUT(可选)由CLIP视觉模型提取的视觉特征,用于视觉风格和内容引导。
起始图像IMAGE(可选)影响生成视频开头的初始图像。
控制视频IMAGE(可选)允许用户提供预处理的ControlNet参考视频,用于引导生成视频的运动和潜在结构。

输出

参数名数据类型描述
负向CONDITIONING提供增强后的正向调节数据,包含编码后的start_image和control_video。
latentCONDITIONING提供同样经过增强的负向调节数据,包含相同的concat_latent_image。
latentLATENT一个包含空潜在张量的字典,键为”samples”。