参数名称 | 说明 |
---|---|
model | 输入待编译的模型,通常来自 Diffusion 模型加载器节点。 |
TorchCompileModelFluxAdvanced
节点功能:将 Flux 模型的特定部分编译为优化的计算图,从而提高推理速度。(beta节点)
输入参数
输出参数
参数名称 | 说明 |
---|---|
MODEL | 返回已编译优化过的模型结构,保持原始结构不变。 |
控件参数
参数名称 | 说明 |
---|---|
backend | 指定 torch.compile 的后端。 |
fullgraph | 是否启用 Full Graph 模式,默认关闭。启用后,编译器尝试将所有操作融合为单一图,可能提升性能,但不稳定,建议在模型确定稳定运行后开启。 |
mode | 设置 Torch Compile 编译策略。 - default:通用模式,推荐初学者使用。 - max-autotune:自动调优以最大化性能。 - max-autotune-no-cudagraphs:兼容性更高的调优模式。 - reduce-overhead:降低资源占用,适合低配环境。 |
double_blocks | 要编译的 double_blocks 层索引,例如:0-2,4,6。double_blocks 是 UNet 中的残差结构,计算密集,优先考虑编译。输入为逗号分隔或范围格式字符串,如 0-3,5,7。 |
single_blocks | 要编译的 single_blocks 层索引,例如:0-10。 |
dynamic | 是否启用动态形状编译,默认关闭。 |
dynamo_cache_size_limit | 设置 dynamo 缓存上限,单位为图数,默认值 64。 |
该节点效果不是很明显。