跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Wan22FunControlToVideo 节点使用 Wan 视频模型架构,为视频生成准备条件化(conditioning)和潜在空间(latent)表示。该节点处理正向和负向条件化输入,以及可选的参考图像和控制视频,为视频合成创建必要的潜在空间表示。节点处理空间缩放和时间维度,以生成适用于视频模型的条件化数据。

输入

参数数据类型是否必填范围描述
正面提示词CONDITIONING-用于引导视频生成的正向条件化输入
负面提示词CONDITIONING-用于引导视频生成的负向条件化输入
VAEVAE-用于将图像编码到潜在空间的 VAE 模型
宽度INT16 至 MAX_RESOLUTION输出视频宽度(像素)(默认值:832,步长:16)
高度INT16 至 MAX_RESOLUTION输出视频高度(像素)(默认值:480,步长:16)
长度INT1 至 MAX_RESOLUTION视频序列中的帧数(默认值:81,步长:4)
批次大小INT1 至 4096要生成的视频序列数量(默认值:1)
参考图像IMAGE-用于提供视觉引导的可选参考图像
控制视频IMAGE-用于引导生成过程的可选控制视频
注意: length 参数以 4 帧为块进行处理,节点会自动处理潜在空间的时间缩放。当提供 ref_image 时,它会通过参考潜在变量影响条件化。当提供 control_video 时,它会直接影响条件化中使用的拼接潜在表示。start_image 参数未作为此节点架构的输入公开,但在执行逻辑中被引用。

输出

输出名称数据类型描述
负向提示CONDITIONING修改后的正向条件化,包含视频特定的潜在数据,包括拼接潜在变量、遮罩和可选的参考潜在变量
潜变量CONDITIONING修改后的负向条件化,包含视频特定的潜在数据,包括拼接潜在变量、遮罩和可选的参考潜在变量
latentLATENT空的潜在张量,具有适合视频生成的适当维度,基于批次大小、潜在通道数以及空间/时间缩放

Source fingerprint (SHA-256): 8b24058f06aa9f779371a402c41cffc95d13ad0131d23d1438067d77755c73e2