was-node-suite-comfyui
时间:2025/11/07
BLIP Model Loader
加载一个BLIP(Bootstrapped Language-Image Pretraining)模型,BLIP模型是用于图像内容描述(captioning)和视觉问答(Visual Question Answering, VQA)的预训练模型,主要应用于让AI“看图说话”或“看图答题”的场景。
BLIP Model Loader-节点参数说明
| 输出参数 | |
| BLIP_MODEL | 输出加载的BLIP_MODEL模型。 |
| 控件参数 | |
| blip_model | 要加载的BLIP图像描述模型的名字或权重。典型用法:直接填写如 Salesforce/blip-image-captioning-base。兼容写法:为兼容 旧脚本,如果输入caption或interrogate,会自动替换为 Sal -esforce/blip-image-captioning-base。作用:决定caption 模型的类型和能力。 |
| vqa_model_id | 用于视觉问答(VQA)的BLIP模型ID。典型用法:如Salesforce/b -lip-vqa-base。作用:决定视觉问答时调用的模型类型;只有涉及 VQA的场景时会用到。 |
| device | 推理使用的设备,选项为 "cuda"(有GPU时使用,推理更快)或"cp u"(无GPU时使用,或者调试时用)。作用:决定加载和运行模型时 用的计算资源。 |

