PatchModelAddDownscale (Kohya Deep Shrink)

节点功能:PatchModelAddDownscale 节点是一个 针对 UNet 模型的结构增强补丁,用于在推理过程中向某个特定的 transformer block 添加下采样和再上采样操作,从而实现节省显存、引入风格变换、抑制细节等目的.适用场景显存紧张:通过中间 downscale 降低显存峰值。风格控制:插入压缩操作可轻度模糊细节,有助于生成更“块面化”风格。Flux / LCM / SDXL 等大模型中降低计算开销。

输入参数

参数名称说明
model输入待打补丁的基础模型。

输出参数

参数名称说明
MODEL应用了指定 block 下采样/还原策略的模型对象。

控件参数

参数名称说明
block_number指定在哪个 UNet block 上应用下采样操作,默认值为 3,范围为 1~32。表示第几个 block,将在此 block 前或后执行下采样,通常设置为中间层以增强全局风格控制。
downscale_factor缩小比例因子,默认值为 2.0,范围为 0.1~9.0。控制特征图的缩小倍数,值越大,信息压缩越强,适合风格抽象表达。推荐值为 1.5~2.5。
start_percent下采样的起始 sigma 百分比(0~1),默认值为 0.0。
end_percent下采样的结束 sigma 百分比(0~1),默认值为 0.35。
downscale_after_skip是否在 skip connection 之后执行下采样,默认值为 True。若为 True,则在 skip 后下采样;若为 False,则在输入 block 前执行下采样。推荐开启以确保结构信息完整
downscale_method用于下采样的算法。选项包括: - bicubic:双三次插值,质量好; - nearest-exact:最邻近像素,硬边效果; - bilinear:双线性插值,常规平滑效果; - area:区域平均,适用于缩小; - bislerp:混合插值,兼顾柔和与精度。 建议使用 bicubic 或 bislerp 以获得更自然的图像特征缩放,nearest-exact 适用于像素风格。
upscale_method用于输出还原上采样的算法。 - bicubic:双三次插值,质量好; - nearest-exact:最邻近像素,硬边效果; - bilinear:双线性插值,常规平滑效果; - area:区域平均,适用于缩小; - bislerp:混合插值,兼顾柔和与精度。

下图为测试示例,大家可以下载工作流自行测评。