IPAdapter Precise Style Transfer

节点功能:该节点继承自 IPAdapterAdvanced,用于在图像生成过程中进行精确风格迁移(Precise Style Transfer),允许你通过可控的 embedding 融合方式,将风格图像的信息注入主模型(如 SD1.5 或 SDXL)中,从而影响最终生成结果的风格、色彩、纹理甚至结构布局。下图为该节点和IPAdapterAdvanced之间的主要区别。

输入参数

参数名称说明
modelStable Diffusion 类型的主模型,用于注入风格特征。
ipadapter已加载的 IPAdapter 模型,包含视觉与注意力融合模块。
image作为风格参考的图像,一般是风格源图。
image_negative用于生成反向嵌入特征(控制不希望出现的风格)。
attn_mask限定风格嵌入在空间上的作用区域。
clip_vision显式传入 CLIP 视觉模型,若为空将从 ipadapter 中提取。

输出参数

参数名称说明
MODEL应用了风格引导的 SD 模型,可继续用于生成或合成。

控件参数

参数名称说明
weight控制参考图对输出图像风格的影响强度。weight 是基础影响系数,控制 image(正向图像)在生成时对最终图像的影响程度,类似 IPAdapterEncoder 中的权重。
style_boost进一步提升风格特征的影响力,主要针对“风格化”程度。style_boost 是额外的风格强化器(通常在融合阶段放大 style 向量的某些维度或其对 attention 的权重),用于生成更鲜明的风格特征输出,常用于风格迁移任务。
combine_embeds多图时嵌入向量合并策略,如拼接、求平均、加法等。 concat: 拼接所有嵌入(信息保留最多,但可能引起不稳定)。 add: 相加融合。 subtract: 以第一个为主,减去其余(风格差异建模)。 average: 求平均风格。 norm average: 归一化后再平均,减少大值主导效应。
start_at指定风格控制的起始推理步数(归一化 0~1)。
end_at指定风格控制的结束推理步数(归一化 0~1)。
embeds_scaling嵌入应用方式,影响 attention 的 Key 和 Value。 "V only":只用于 Value,风格仅作用于输出的内容强度。 "K+V":用于 Key 和 Value,加强风格控制但可能影响图像结构。 "K+V w/ C penalty":加入正则项平衡风格控制与结构一致性。 "K+mean(V) w/ C penalty":在上述基础上增强稳定性。 一般任务使用 "V only" 即可,高风格迁移任务可尝试 "K+V w/ C penalty"。

下图所示为示例效果,对比效果图和参考图,可以看到Precise节点增强对风格的参考,对原图中人物的位置没有过多参考,而advanced似乎整体的画面都参考。(总而言之,参数对最终出图的影响太难去用科学的方式解释,只能通过不断地测试才能发现其中的区别,希望大家可以多动手尝试和总结这些内容。)