Patch Sage Attention KJ

节点功能:用于优化模型的注意力机制,提高推理速度。(加速效果不明显

输入参数

参数名称说明
model输入待应用注意力机制 patch 的模型。

输出参数

参数名称说明
MODEL返回应用了 SageAttention 全局 Patch 的模型。

控件参数

参数名称说明
sage_attention指定 SageAttention 模式,修改 ComfyUI 的全局 Attention 实现。 - disabled:关闭 SageAttention,恢复默认 Comfy Attention。 - auto:自动判断后端适配模式(推荐)。 - sageattn_qk_int8_pv_fp16_cuda:NVIDIA FP16 模式,速度快、兼容性好。 - sageattn_qk_int8_pv_fp16_triton:Triton 编译版本,适合特定 GPU。 - sageattn_qk_int8_pv_fp8_cuda:FP8 精度版本,极致加速但可能有精度偏差。