节点功能:基于智谱 GLM-4V 图文大模型 实现视觉问答(VQA)、图像描述、图文对话等任务。
ComfyUI_LayerStyle_Advance
LayerUtility: ZhipuGLM4V(Advance)
LayerUtility: ZhipuGLM4V(Advance)-节点参数说明
输入参数 | |
image | 输入图像,传入模型进行图像理解。 |
输出参数 | |
text | 模型返回的文字回答。基于图像与提问生成的描述文本。 |
控件参数 | |
model | 调用的智谱多模态模型名称。可选值:glm-4v-flash, glm-4v, glm-4v-plus。 |
user_prompt | 用户提问内容,作为模型接收图像后的理解指令。支持多行。 |