本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑StableZero123_Conditioning 节点处理输入图像和相机角度,为 3D 模型生成生成条件数据和潜在表示。它使用 CLIP 视觉模型编码图像特征,根据仰角和方位角将图像特征与相机嵌入信息相结合,并生成正向和负向条件数据以及用于下游 3D 生成任务的潜在表示。
输入
| 参数 | 数据类型 | 必填 | 范围 | 描述 |
|---|---|---|---|---|
clip视觉 | CLIP_VISION | 是 | - | 用于编码图像特征的 CLIP 视觉模型 |
初始图像 | IMAGE | 是 | - | 待处理和编码的输入图像 |
vae | VAE | 是 | - | 用于将像素编码到潜在空间的 VAE 模型 |
宽度 | INT | 是 | 16 至 MAX_RESOLUTION | 潜在表示的输出宽度(默认值:256,必须能被 8 整除) |
高度 | INT | 是 | 16 至 MAX_RESOLUTION | 潜在表示的输出高度(默认值:256,必须能被 8 整除) |
批量大小 | INT | 是 | 1 至 4096 | 批次中生成的样本数量(默认值:1) |
俯仰角 | FLOAT | 是 | -180.0 至 180.0 | 相机仰角(度)(默认值:0.0) |
方位角 | FLOAT | 是 | -180.0 至 180.0 | 相机方位角(度)(默认值:0.0) |
width 和 height 参数必须能被 8 整除,因为节点会自动将它们除以 8 来创建潜在表示的维度。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
负面条件 | CONDITIONING | 结合图像特征和相机嵌入的正向条件数据 |
Latent | CONDITIONING | 使用零初始化特征的负向条件数据 |
latent | LATENT | 维度为 [batch_size, 4, height//8, width//8] 的潜在表示 |
Source fingerprint (SHA-256):
a9d6619c800119c9a619665f322d49ded1478ceb40df56ca5707b31242cb0e47