本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑此节点专门用于通过针对 SDXL 架构定制的 CLIP 模型对文本输入进行编码。它采用双编码器系统(CLIP-L 和 CLIP-G)来处理文本描述,从而生成更精确的图像。
输入
| 参数 | 数据类型 | 描述 |
|---|---|---|
clip | CLIP | 用于文本编码的 CLIP 模型实例。 |
宽度 | INT | 指定图像宽度(像素),默认为 1024。 |
高度 | INT | 指定图像高度(像素),默认为 1024。 |
裁剪宽 | INT | 裁剪区域的宽度(像素),默认为 0。 |
裁剪高 | INT | 裁剪区域的高度(像素),默认为 0。 |
目标宽度 | INT | 输出图像的目标宽度,默认为 1024。 |
目标高度 | INT | 输出图像的目标高度,默认为 1024。 |
文本_g | STRING | 用于整体场景描述的全局文本描述。 |
文本_l | STRING | 用于细节描述的局部文本描述。 |
输出
| 参数 | 数据类型 | 描述 |
|---|---|---|
CONDITIONING | CONDITIONING | 包含图像生成所需的编码文本和条件信息。 |