节点功能:加载多模态视觉语言模型 (VLM) ,专门用于 图像理解与描述生成。
模型下载:到插件主页的网盘链接中下载整个LLM文件夹,直接放到ComfyUI/models文件夹。
节点功能:加载多模态视觉语言模型 (VLM) ,专门用于 图像理解与描述生成。
输出参数 | |
joy2_model | 返回已加载的 JoyCaption2 模型对象与所使用的设备,封装于列表中。 |
控件参数 | |
llm_model | 选择加载的语言模型名称。 |
device | 指定推理设备,目前仅支持 'cuda'。 |
dtype | 模型加载的权重量化类型。可选值包括: - nf4:低比特精度,高效运行; - bf16:较高精度。 |
vlm_lora | 选择是否加载视觉语言微调权重(LoRA)。可选值: - text_model:加载文本 LoRA。 - none:不加载。 |
模型下载:到插件主页的网盘链接中下载整个LLM文件夹,直接放到ComfyUI/models文件夹。