本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑CLIPTextEncodeHiDream 节点使用不同的语言模型(CLIP-L、CLIP-G、T5-XXL 和 LLaMA)处理四个独立的文本输入,并将它们合并为单个 conditioning 输出。它会使用对应的模型对每个文本输入进行分词,并通过调度编码方法将它们一起编码,从而通过同时利用多个语言模型实现更复杂的文本 conditioning。
输入
| 参数 | 数据类型 | 是否必填 | 范围 | 描述 |
|---|---|---|---|---|
clip | CLIP | 是 | - | 用于分词和编码的 CLIP 模型 |
clip_l | STRING | 是 | - | 用于 CLIP-L 模型处理的文本输入。支持多行文本和动态提示。 |
clip_g | STRING | 是 | - | 用于 CLIP-G 模型处理的文本输入。支持多行文本和动态提示。 |
t5xxl | STRING | 是 | - | 用于 T5-XXL 模型处理的文本输入。支持多行文本和动态提示。 |
llama | STRING | 是 | - | 用于 LLaMA 模型处理的文本输入。支持多行文本和动态提示。 |
clip_l、clip_g、t5xxl 和 llama)均为正常运行所必需,因为每个输入都会通过调度编码过程对最终的 conditioning 输出做出贡献。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
CONDITIONING | CONDITIONING | 来自所有已处理文本输入的合并 conditioning 输出,使用调度编码方法进行编码 |
Source fingerprint (SHA-256):
51d117d82a9d833f095e874bf442d5cf8c46a12313fda6b98e628fa988797565