CLIP 是一个用于图文匹配的模型,它通过多个 Transformer 层编码文本。默认来说,它使用的是最后一层输出(layer 12),但:
- skip 的意思是“跳过”最后几层
- 例如:clip_skip = 1 表示“使用倒数第 2 层”作为最终输出
- clip_skip = -1 通常表示“保持默认设置”
如下图所示,为不同的layer对最终结果的影响。
输出参数 | |
X or Y | 输出类型为 "Clip Skip" 或 "Clip Skip (Refiner)" 的 XY Capsule,包含整数序列。 |
控件参数 | |
target_ckpt | 选择目标模型类型,可选值为 "Base" 或 "Refiner"。 |
batch_count | 生成多少组 clip_skip 数值。默认值为 XYPLOT_DEF,最大限制为 XYPLOT_LIM。 |
first_clip_skip | clip_skip 的起始值,范围为 -24 到 -1,负值代表从原始层倒数 |
last_clip_skip | clip_skip 的结束值,范围为 -24 到 -1。 |
CLIP 是一个用于图文匹配的模型,它通过多个 Transformer 层编码文本。默认来说,它使用的是最后一层输出(layer 12),但:
如下图所示,为不同的layer对最终结果的影响。
可加入知识星球获取所有示例工作流
微信扫码入群,加入AIGC大家庭,与大家一起交流学习