跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
GeminiImage 节点通过 Google 的 Gemini AI 模型生成文本和图像响应。它允许您提供多模态输入,包括文本提示、图像和文件,以生成连贯的文本和图像输出。该节点处理与最新 Gemini 模型的所有 API 通信和响应解析。

输入

参数数据类型输入类型默认值范围描述
提示词STRING必需""-用于生成的文本提示
模型COMBO必需gemini_2_5_flash_image_preview可用的 Gemini 模型
选项从 GeminiImageModel 枚举中提取
用于生成响应的 Gemini 模型
种子INT必需420 到 18446744073709551615当种子固定为特定值时,模型会尽力为重复请求提供相同的响应。但无法保证确定性输出。此外,更改模型或参数设置(如温度)可能会导致响应发生变化,即使使用相同的种子值也是如此。默认情况下,使用随机种子值
图像IMAGE可选None-可选图像,用作模型的上下文。要包含多个图像,可以使用批量图像节点
文件GEMINI_INPUT_FILES可选None-可选文件,用作模型的上下文。接受来自 Gemini 生成内容输入文件节点的输入
注意:该节点包含隐藏参数(auth_tokencomfy_api_keyunique_id),这些参数由系统自动处理,无需用户输入。

输出

输出名称数据类型描述
IMAGEIMAGE来自 Gemini 模型的生成图像响应
STRINGSTRING来自 Gemini 模型的生成文本响应