ComfyUI_LayerStyle_Advance

LayerUtility: ZhipuGLM4V(Advance)

节点功能:基于智谱 GLM-4V 图文大模型 实现视觉问答(VQA)、图像描述、图文对话等任务。


LayerUtility: ZhipuGLM4V(Advance)-节点参数说明
输入参数
image输入图像,传入模型进行图像理解。
输出参数
text模型返回的文字回答。基于图像与提问生成的描述文本。
控件参数
model调用的智谱多模态模型名称。可选值:glm-4v-flash, glm-4v, glm-4v-plus。
user_prompt用户提问内容,作为模型接收图像后的理解指令。支持多行。