ComfyUI_LayerStyle_Advance

LayerUtility: PromptTagger(Advance)

节点功能:基于Gemini视觉API的智能图像标签生成器,可将任意图像自动转换为适合Stable Diffusion的优化提示词(prompt),支持关键词替换和语义增强。


LayerUtility: PromptTagger(Advance)-节点参数说明
输入参数
image输入图像,用于提取和生成 Stable Diffusion 所需的英文 prompt。
输出参数
text返回 Gemini 模型生成的英文 Stable Diffusion Prompt,已按需排除或替换指定关键词。
控件参数
api选择使用的 Gemini 模型 API。可选项包括: • gemini-1.5-flash • gemini-pro-vision 推荐选择 gemini-pro-vision,支持多模态图像理解。gemini-1.5-flash 更轻量,适用于通用处理但不支持图像输入。
token_limit控制输出 prompt 的最大 token 数(词数)。范围 2~1024,默认值为 80。
exclude_word要排除或替换的关键词或短语,可用于纠正模型生成的标签。
replace_with_word替代关键词,若不为空则用于替换 exclude_word 中的词。

文本编辑需要pro版本。