IPAdapter Tiled Batch

节点功能:该节点可以输入非正方形的图像,然后对整体分块进行参考,让最终生成的图像参考原图的全部信息

输入参数

参数名称说明
model主要的图像生成模型(如 SD 1.5 / SDXL 等)。
ipadapterIPAdapter 模型结构,可能包含视觉模型(clip_vision)。
image用于提取嵌入特征的风格图像,将被切分为多个 tile。
image_negative负面风格图像,可用于风格抑制。
attn_mask注意力遮罩,只对图像特定区域注入风格。
clip_visionCLIP视觉模型,可覆盖默认绑定的 clipvision 模块。

输出参数

参数名称说明
MODEL注入了多个 tile 风格嵌入后的模型。
tiles所有切片后的 tile 图像合并(按批次拼接)。
masks每个 tile 对应的 attention mask 合并结果。

控件参数

参数名称说明
weight融合嵌入的强度,默认 1.0,范围为 -1 到 3。
weight_type权重调节方式,如 constant、linear、step、fade。
start_at嵌入生效的起始时间点(0~1),默认 0。
end_at嵌入生效的结束时间点(0~1),默认 1。
sharpening对 tile 图像应用的锐化程度(0~1),默认 0,提升细节识别能力。 对每个 tile 应用自适应锐化(contrast adaptive sharpening); 有助于提升 CLIP 对 tile 的理解能力; 建议在风格图模糊或压缩时使用 0.2~0.5 的值
embeds_scaling 多 tile 嵌入的合并方式:concat, add, subtract, average, norm average。 concat 拼接特征,适合保持 tile 独立性,但可能维度爆炸。 add/subtract 加权或差异融合,可用于增强或对比风格特征。 average 平均化合并,平滑过渡但易丢细节。 norm average 加入归一化,减少异常值影响,更稳健。 建议默认用 average 或 norm average,更平衡。
encode_batch_size控制每次编码器处理的 tile 数,默认 0 表示自动分批或一次性处理全部。 如果一次处理 tile 太多,容易 VRAM 爆炸; 你可以设置为如 4、8 等数值,控制每批传给 CLIP 的 tile 数量; 若为 0,则不进行人为拆分,交由框架处理。

注意:如下图所示,输入图像为长方形,而且并没有对原始图像进行预处理裁剪,经过Tile节点之后,对原始图像进行分割,输出为两块参考图像,最终生成的图像参考了原图的上下两部分,然后生成如图所示的图像。



注意:如下图所示,在原图中绘制蒙版,然后将蒙版传入Tiled节点之后,节点会对蒙版也进行相应的裁剪和原始图像一一对应,最终生成的图像只参考蒙版区域进行模仿。