IPAdapter ClipVision Enhancer

节点功能:该节点能把你给它的参考图片切成几块来认真分析细节,然后用这些细节来指导 AI 画图,让最终生成的图更像参考图的风格、色彩和感觉。该节点是ipadapter advanced的拓宽,下图为主要区别。

输入参数

参数名称说明
model当前正在使用的主模型(例如 SD1.5 或 SDXL 模型)。
ipadapter已加载的 IPAdapter 模型结构,用于视觉信息引导。
image用于引导的输入图像,通常是样式图、参考图或局部区域图。
image_negative负向引导图像,通常用于控制反面特征(例如不希望出现的图像风格)。
attn_mask控制图像引导影响范围的遮罩。
clip_vision外部提供的视觉编码器,若未提供,则使用默认的模型内置编码器。

输出参数

参数名称说明
MODEL注入图像增强条件后的模型,供后续采样节点使用。

控件参数

参数名称说明
weight图像引导的权重。值越大影响越强,允许负值进行反向引导。范围:[-1, 5]。
weight_type权重计算类型(来自 WEIGHT_TYPES,如 linear、cosine 等)。
combine_embeds指定特征缩放的策略,影响 Key/Value/Context 的处理。 V only:仅缩放 value 向量,影响相对较小。 K+V:同时缩放 key 和 value,增强匹配能力。 K+V w/ C penalty:加入惩罚项约束,防止过拟合。 K+mean(V) w/ C penalty:对 value 求平均再缩放,提升语义一致性。 默认使用 K+V 通常效果良好,其他选项适合高级用户尝试风格控制或精度微调。|
start_at指定在采样的哪个时间点开始使用 IPAdapter(范围 0.0 ~ 1.0)。
end_at指定在采样的哪个时间点停止使用 IPAdapter(范围 0.0 ~ 1.0)。
embeds_scaling控制图像特征编码时的批大小,设为 0 时使用默认推理策略。
enhance_tiles将输入图像划分为几块进行增强,数值越高图像越局部处理。这是一个关键参数,它控制将输入图像划分为多少个 tile(例如,值为 2 时图像会划分为 2x2 的四个区域)。数值越高,增强越局部,图像结构保持性更强,但计算量也更大,推荐在显存足够时使用 2~4。
enhance_ratio指定增强区域与原图融合的比例。用于控制每个 tile 特征和原始整体特征之间的融合比例。例如设为 0.5 表示新 tile 特征和整体图像特征各占一半,适合在保持整体构图的同时增强细节表现。

如下图所示,当我们设置enhance tiles相当于整张图分成一块,那该节点的功能就跟ipadapter advanced完全相同。

下图所示为示例演示,不同的分块参考情况会影响效果,具体的大家可以看图分析主要视觉特征的区别,也可以使用示例工作流进行实验测试。