跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
CLIPTextEncodeHiDream 节点使用不同的语言模型(CLIP-L、CLIP-G、T5-XXL 和 LLaMA)处理四个独立的文本输入,并将它们合并为单个 conditioning 输出。它会使用对应的模型对每个文本输入进行分词,并通过调度编码方法将它们一起编码,从而通过同时利用多个语言模型实现更复杂的文本 conditioning。

输入

参数数据类型是否必填范围描述
clipCLIP-用于分词和编码的 CLIP 模型
clip_lSTRING-用于 CLIP-L 模型处理的文本输入。支持多行文本和动态提示。
clip_gSTRING-用于 CLIP-G 模型处理的文本输入。支持多行文本和动态提示。
t5xxlSTRING-用于 T5-XXL 模型处理的文本输入。支持多行文本和动态提示。
llamaSTRING-用于 LLaMA 模型处理的文本输入。支持多行文本和动态提示。
注意: 所有四个文本输入(clip_lclip_gt5xxlllama)均为正常运行所必需,因为每个输入都会通过调度编码过程对最终的 conditioning 输出做出贡献。

输出

输出名称数据类型描述
CONDITIONINGCONDITIONING来自所有已处理文本输入的合并 conditioning 输出,使用调度编码方法进行编码

Source fingerprint (SHA-256): 51d117d82a9d833f095e874bf442d5cf8c46a12313fda6b98e628fa988797565