Prep Image For ClipVision

节点功能:这个节点 PrepImageForClipVision 是 IPAdapter 插件体系中的一个实用工具节点,主要用于在将图像输入 CLIP Vision 模型之前,对图像做裁剪、缩放、锐化处理,以符合 CLIP 模型的最佳输入需求(通常是 224×224 的方图)。把一张图处理成 CLIP Vision 模型喜欢的“标准方图”,保持细节、居中裁切、可选锐化。

输入参数

参数名称说明
image输入图像,通常形状为 [B, H, W, C],用于送入 CLIP Vision 模型。

输出参数

参数名称说明
IMAGE已处理好的图像,形状为 [B, 224, 224, 3],可直接送入 CLIP Vision 模型。

控件参数

参数名称说明
interpolation插值方法,PIL 支持的插值模式,用于缩放图像到 224×224,默认 LANCZOS。 LANCZOS:高质量慢速缩放,适合锐利图像 BICUBIC:平滑且较快,适合常规用途 NEAREST:最近邻,像素化效果 建议图像质量要求高时使用 LANCZOS。
crop_position裁剪方式,包括 "center"、"top"、"bottom" 等,用于统一图像比例。 该参数决定了如何将输入图像裁剪为正方形,以适配 CLIP 模型的输入需求: "center":从中心裁剪。 "top" / "bottom":靠上或靠下对齐裁剪。 "left" / "right":靠左或靠右对齐裁剪。 "pad":不裁剪而是等边填充 0,让图像变为正方形。 注意:“pad”模式不会截断图像内容,而是通过黑边填充。适合保留全图信息。
sharpening图像锐化强度,范围 [0.0, 1.0],通过自适应对比度提升细节。

从下图所示,可以看到该节点可以完成原图的预处理,可以做填充,或者裁剪等等,总而言之是处理到CLIP的最佳输入224*224.