TorchCompileModelFluxAdvanced

节点功能:将 Flux 模型的特定部分编译为优化的计算图,从而提高推理速度。(beta节点

输入参数

参数名称说明
model输入待编译的模型,通常来自 Diffusion 模型加载器节点。

输出参数

参数名称说明
MODEL返回已编译优化过的模型结构,保持原始结构不变。

控件参数

参数名称说明
backend指定 torch.compile 的后端。
fullgraph是否启用 Full Graph 模式,默认关闭。启用后,编译器尝试将所有操作融合为单一图,可能提升性能,但不稳定,建议在模型确定稳定运行后开启。
mode设置 Torch Compile 编译策略。 - default:通用模式,推荐初学者使用。 - max-autotune:自动调优以最大化性能。 - max-autotune-no-cudagraphs:兼容性更高的调优模式。 - reduce-overhead:降低资源占用,适合低配环境。
double_blocks要编译的 double_blocks 层索引,例如:0-2,4,6。double_blocks 是 UNet 中的残差结构,计算密集,优先考虑编译。输入为逗号分隔或范围格式字符串,如 0-3,5,7。
single_blocks要编译的 single_blocks 层索引,例如:0-10。
dynamic是否启用动态形状编译,默认关闭。
dynamo_cache_size_limit设置 dynamo 缓存上限,单位为图数,默认值 64。

该节点效果不是很明显。