参数名称 | 说明 |
---|---|
model | 输入待应用注意力机制 patch 的模型。 |
Patch Sage Attention KJ
节点功能:用于优化模型的注意力机制,提高推理速度。(加速效果不明显)
输入参数
输出参数
参数名称 | 说明 |
---|---|
MODEL | 返回应用了 SageAttention 全局 Patch 的模型。 |
控件参数
参数名称 | 说明 |
---|---|
sage_attention | 指定 SageAttention 模式,修改 ComfyUI 的全局 Attention 实现。 - disabled:关闭 SageAttention,恢复默认 Comfy Attention。 - auto:自动判断后端适配模式(推荐)。 - sageattn_qk_int8_pv_fp16_cuda:NVIDIA FP16 模式,速度快、兼容性好。 - sageattn_qk_int8_pv_fp16_triton:Triton 编译版本,适合特定 GPU。 - sageattn_qk_int8_pv_fp8_cuda:FP8 精度版本,极致加速但可能有精度偏差。 |