GeminiImageNode - ComfyUI Built-in Node Documentation

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

GeminiImage 节点通过 Google 的 Gemini AI 模型生成文本和图像响应。它允许您提供多模态输入，包括文本提示、图像和文件，以生成连贯的文本和图像输出。该节点处理与最新 Gemini 模型的所有 API 通信和响应解析。

输入

参数	数据类型	输入类型	默认值	范围	描述
`提示词`	STRING	必需	""	-	用于生成的文本提示
`模型`	COMBO	必需	gemini_2_5_flash_image_preview	可用的 Gemini 模型选项从 GeminiImageModel 枚举中提取	用于生成响应的 Gemini 模型
`种子`	INT	必需	42	0 到 18446744073709551615	当种子固定为特定值时，模型会尽力为重复请求提供相同的响应。但无法保证确定性输出。此外，更改模型或参数设置（如温度）可能会导致响应发生变化，即使使用相同的种子值也是如此。默认情况下，使用随机种子值
`图像`	IMAGE	可选	None	-	可选图像，用作模型的上下文。要包含多个图像，可以使用批量图像节点
`文件`	GEMINI_INPUT_FILES	可选	None	-	可选文件，用作模型的上下文。接受来自 Gemini 生成内容输入文件节点的输入

注意：该节点包含隐藏参数（auth_token、comfy_api_key、unique_id），这些参数由系统自动处理，无需用户输入。

输出名称	数据类型	描述
`IMAGE`	IMAGE	来自 Gemini 模型的生成图像响应
`STRING`	STRING	来自 Gemini 模型的生成文本响应