SDXL Empty Latent Image (rgthree)

节点功能:提供SDXL的空潜空间图片, 实际也可以用于flux或者sd3模型(代替empty latent进行使用,并且多了一个裁剪参数

输出参数

参数名称说明
LATENT空潜空间图像张量。
CLIP_WIDTHclip 预处理宽度。
CLIP_HEIGHTclip 预处理高度。

控件参数

参数名称说明
dimensions预设的图像分辨率(9种 SDXL 常用分辨率)。不支持自定义分辨率,只能从预设中选。适合快速创建符合 SDXL 要求的 latent。
clip_scaleclip 尺寸缩放系数。用于计算输出的 CLIP_WIDTH 和 CLIP_HEIGHT。通常设为 2.0,匹配 SDXL 输入规格。
batch_size批处理生成图像数量。

能在dimensions选择预设的尺寸。

clip_scale 参数的作用是:用于计算 CLIP 模型输入的宽度和高度,以确保它与生成的 latent 图像尺寸相匹配或适配。在 SDXL 等扩散模型中,CLIP 模型用于对提示词进行编码(如正向 prompt 或反向 negative prompt)。CLIP 编码器通常需要知道目标图像的「感知尺寸」(perceived resolution),它不直接处理 latent,但它的感知图像尺寸影响其对文本的理解细节程度。

📐 clip_scale 如何运作

dimensions = 1024 x 1024clip_scale = 2.0 为例:

clip_width  = 1024 * 2.0 = 2048
clip_height = 1024 * 2.0 = 2048

最终输出的 CLIP_WIDTH = 2048, CLIP_HEIGHT = 2048 可以作为输入传入一些支持的提示词编码器,例如:

CLIPTextEncode(clip, text, width=clip_width, height=clip_height)

这表示我们期望 CLIP 编码器理解文本时,是为一张 2048×2048 的图像服务的,但是它最终生成的图片依旧是1024×1024