跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
WanPhantomSubjectToVideo 节点通过处理条件化输入和可选的参考图像来生成视频内容。它会为视频生成创建潜在表示,并在提供输入图像时融入其中的视觉引导。该节点为视频模型准备带有时间维度拼接的条件化数据,并输出修改后的条件化数据以及生成的潜在视频数据。

输入

参数数据类型是否必填范围描述
正面提示词CONDITIONING-用于引导视频生成的正面条件化输入
负面提示词CONDITIONING-用于避免特定特征的负面条件化输入
VAEVAE-用于在提供图像时进行编码的 VAE 模型
宽度INT16 至 MAX_RESOLUTION输出视频的宽度(像素,默认值:832,必须能被 16 整除)
高度INT16 至 MAX_RESOLUTION输出视频的高度(像素,默认值:480,必须能被 16 整除)
长度INT1 至 MAX_RESOLUTION生成视频的帧数(默认值:81,必须能被 4 整除)
批次大小INT1 至 4096同时生成的视频数量(默认值:1)
图像IMAGE-用于时间维度条件化的可选参考图像
注意: 当提供 images 时,它们会自动放大以匹配指定的 widthheight,并且仅使用前 length 帧进行处理。

输出

输出名称数据类型描述
负面文本CONDITIONING当提供图像时,经过时间维度拼接修改后的正面条件化数据
负面图像文本CONDITIONING当提供图像时,经过时间维度拼接修改后的负面条件化数据
潜变量CONDITIONING当提供图像时,使用零值时间维度拼接的负面条件化数据
latentLATENT生成的具有指定尺寸和长度的潜在视频表示

Source fingerprint (SHA-256): 2e3e8277dca9e998220fc5939c2cc72fdc15e80cc4b95daa33f5b92e2270dd73