本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑此节点通过编码图像和文本来准备训练数据。它接收图像列表及对应的文本描述列表,然后使用 VAE 模型将图像转换为潜在表示,并使用 CLIP 模型将文本转换为条件数据。生成的成对潜在表示和条件数据以列表形式输出,可直接用于训练流程。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
图像 | IMAGE | 是 | 无 | 待编码的图像列表。 |
VAE | VAE | 是 | 无 | 用于将图像编码为潜在表示的 VAE 模型。 |
CLIP | CLIP | 是 | 无 | 用于将文本编码为条件数据的 CLIP 模型。 |
文本 | STRING | 否 | 无 | 文本描述列表。长度可为 n(与图像数量匹配)、1(对所有图像重复使用)或省略(使用空字符串)。 |
texts列表中的项目数量必须为 0、1 或与images列表中的项目数量完全一致。若为 0,则所有图像使用空字符串;若为 1,则对所有图像重复使用该单一文本。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
条件 | LATENT | 潜在字典列表。 |
conditioning | CONDITIONING | 条件列表的列表。 |
Source fingerprint (SHA-256):
95947c03f140f527f3db54d0b0131d956646055542ddb546ae5eaa82e4e8cefa