CLIP 是一个用于图文匹配的模型,它通过多个 Transformer 层编码文本。默认来说,它使用的是最后一层输出(layer 12),但:
- skip 的意思是“跳过”最后几层
 - 例如:clip_skip = 1 表示“使用倒数第 2 层”作为最终输出
 - clip_skip = -1 通常表示“保持默认设置”
 
如下图所示,为不同的layer对最终结果的影响。
| 输出参数 | |
| X or Y | 输出类型为 "Clip Skip" 或 "Clip Skip (Refiner)" 的 XY Capsule,包含整数序列。 | 
| 控件参数 | |
| target_ckpt | 选择目标模型类型,可选值为 "Base" 或 "Refiner"。 | 
| batch_count | 生成多少组 clip_skip 数值。默认值为 XYPLOT_DEF,最大限制为 XYPLOT_LIM。 | 
| first_clip_skip | clip_skip 的起始值,范围为 -24 到 -1,负值代表从原始层倒数 | 
| last_clip_skip | clip_skip 的结束值,范围为 -24 到 -1。 | 
CLIP 是一个用于图文匹配的模型,它通过多个 Transformer 层编码文本。默认来说,它使用的是最后一层输出(layer 12),但:
如下图所示,为不同的layer对最终结果的影响。

可加入知识星球获取所有示例工作流

微信扫码入群,加入AIGC大家庭,与大家一起交流学习