跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
StableZero123_Conditioning 节点处理输入图像和相机角度,为 3D 模型生成生成条件数据和潜在表示。它使用 CLIP 视觉模型编码图像特征,根据仰角和方位角将图像特征与相机嵌入信息相结合,并生成正向和负向条件数据以及用于下游 3D 生成任务的潜在表示。

输入

参数数据类型必填范围描述
clip视觉CLIP_VISION-用于编码图像特征的 CLIP 视觉模型
初始图像IMAGE-待处理和编码的输入图像
vaeVAE-用于将像素编码到潜在空间的 VAE 模型
宽度INT16 至 MAX_RESOLUTION潜在表示的输出宽度(默认值:256,必须能被 8 整除)
高度INT16 至 MAX_RESOLUTION潜在表示的输出高度(默认值:256,必须能被 8 整除)
批量大小INT1 至 4096批次中生成的样本数量(默认值:1)
俯仰角FLOAT-180.0 至 180.0相机仰角(度)(默认值:0.0)
方位角FLOAT-180.0 至 180.0相机方位角(度)(默认值:0.0)
注意: widthheight 参数必须能被 8 整除,因为节点会自动将它们除以 8 来创建潜在表示的维度。

输出

输出名称数据类型描述
负面条件CONDITIONING结合图像特征和相机嵌入的正向条件数据
LatentCONDITIONING使用零初始化特征的负向条件数据
latentLATENT维度为 [batch_size, 4, height//8, width//8] 的潜在表示

Source fingerprint (SHA-256): a9d6619c800119c9a619665f322d49ded1478ceb40df56ca5707b31242cb0e47