跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
CLIPLoader 节点用于从文件加载文本编码器模型(CLIP、T5 或类似模型),使其可供其他需要将文本提示转换为数值表示的节点使用。该节点支持多种模型架构,每种架构需要特定的编码器类型。

输入

参数数据类型是否必需取值范围描述
CLIP名称STRINGtext_encoders 文件夹中找到的文件列表要加载的文本编码器模型文件名。该文件必须位于 ComfyUI/models/text_encoders/ComfyUI/models/clip/ 目录中。
类型STRING"stable_diffusion"
"stable_cascade"
"sd3"
"stable_audio"
"mochi"
"ltxv"
"pixart"
"cosmos"
"lumina2"
"wan"
"hidream"
"chroma"
"ace"
"omnigen2"
"qwen_image"
"hunyuan_image"
"flux2"
"ovis"
"longcat_image"
"cogvideox"
所加载模型的架构类型。这决定了使用哪个具体的编码器变体。默认值为 "stable_diffusion"
设备STRING"default"
"cpu"
加载模型的目标设备。"default" 在可用时使用 GPU,而 "cpu" 强制使用 CPU 加载。这是一个高级选项(默认值:"default")。

支持的编码器类型映射

type 参数为给定的模型架构选择正确的编码器。以下是常见的映射关系:
类型编码器
stable_diffusionclip-l
stable_cascadeclip-g
sd3t5 xxl / clip-g / clip-l
stable_audiot5 base
mochit5 xxl
cogvideoxt5 xxl(226 令牌填充)
cosmosold t5 xxl
lumina2gemma 2 2B
wanumt5 xxl
hidreamllama-3.1(推荐)或 t5
omnigen2qwen vl 2.5 3B

输出

输出名称数据类型描述
clipCLIP已加载的文本编码器模型,可连接到其他节点进行文本编码和条件控制。

Source fingerprint (SHA-256): 1051bfe5570dff81719682cb09938bae4c03e94e0e72f7a2be84867cccb48017