ComfyUI_LayerStyle_Advance

LayerUtility: Gemini(Advance)

节点功能:用于 调用Google Gemini系列大模型 的接口工具,支持 多模态输入(文本+图像) 和 结构化提示工程,主要应用于生成适配Stable Diffusion的图像提示词(Prompt)或其他文本生成任务。


LayerUtility: Gemini(Advance)-节点参数说明
输入参数
image_1可选输入图像(第一组)。
image_2可选输入图像(第二组,与 image_1 配对)。
输出参数
textGemini 返回的响应文本组成的列表。
控件参数
modelGemini 模型名称,如 "gemini-1.5-pro"。
max_output_tokens最大生成 token 数量(非词数)。
temperature随机性控制,越高越随机。
words_limit目标响应的词数限制。
response_language响应语言,支持 "en" 或 "zh-CN"。
system_prompt系统角色设定,用于定义任务类型(如“你正在生成 SD 图像提示词”)。
user_prompt用户输入提示词,将作为核心任务指令。

使用Google Gemini API进行文字及视觉模型进行本地推理。可以用于生成提示词,加工提示词或者反推图片的提示词。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。


不需要输入图片生成提示词。

words_limit: 输出文本长度限制


输入图片后可以实现图片的提示词描述。

输入两张图片的时候它能分开描述。