本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑GeminiImage 节点通过 Google 的 Gemini AI 模型生成文本和图像响应。它允许您提供多模态输入,包括文本提示、图像和文件,以生成连贯的文本和图像输出。该节点处理与最新 Gemini 模型的所有 API 通信和响应解析。
输入
| 参数 | 数据类型 | 输入类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|---|
提示词 | STRING | 必需 | "" | - | 用于生成的文本提示 |
模型 | COMBO | 必需 | gemini_2_5_flash_image_preview | 可用的 Gemini 模型 选项从 GeminiImageModel 枚举中提取 | 用于生成响应的 Gemini 模型 |
种子 | INT | 必需 | 42 | 0 到 18446744073709551615 | 当种子固定为特定值时,模型会尽力为重复请求提供相同的响应。但无法保证确定性输出。此外,更改模型或参数设置(如温度)可能会导致响应发生变化,即使使用相同的种子值也是如此。默认情况下,使用随机种子值 |
图像 | IMAGE | 可选 | None | - | 可选图像,用作模型的上下文。要包含多个图像,可以使用批量图像节点 |
文件 | GEMINI_INPUT_FILES | 可选 | None | - | 可选文件,用作模型的上下文。接受来自 Gemini 生成内容输入文件节点的输入 |
auth_token、comfy_api_key、unique_id),这些参数由系统自动处理,无需用户输入。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
IMAGE | IMAGE | 来自 Gemini 模型的生成图像响应 |
STRING | STRING | 来自 Gemini 模型的生成文本响应 |