mimic_mode、cfg_mode参数说明:
| 模式 | 含义 | 
|---|---|
Constant | 始终保持 CFG scale 不变(即为 cfg 参数值) | 
Linear Down | 从 cfg 值线性减小到 cfg_scale_min | 
Cosine Down | 用余弦曲线平滑下降到 cfg_scale_min | 
Half Cosine Down | 使用半周期余弦下降 | 
Linear Up | 从 cfg_scale_min 线性增长到 cfg 值 | 
Cosine Up | 使用余弦函数缓慢增长到 cfg 值 | 
Half Cosine Up | 使用半周期余弦上升 | 
Power Up | 非线性幂函数方式上升,幂次由 sched_val 控制 | 
Power Down | 非线性幂函数方式下降,幂次由 sched_val 控制 | 
Linear Repeating | 线性周期变化 | 
Cosine Repeating | 余弦周期变化 | 
Sawtooth | 锯齿状周期性变化 | 
举例说明:
| 参数设置 | 效果 | 
|---|---|
cfg=8.0, cfg_mode="Linear Down", cfg_scale_min=3.5 | CFG scale 会从 8.0 线性下降到 3.5,增强起始步骤的引导力度,后期更自由 | 
cfg=8.0, cfg_mode="Cosine Repeating", cfg_scale_min=3.5 | CFG 会在 8.0 和 3.5 之间按余弦波周期上下摆动,效果更富变化性 | 
cfg=6.0, cfg_mode="Power Up", cfg_scale_min=3.5, sched_val=2 | CFG 从 3.5 开始非线性缓慢增长到 6.0,适合逐步加强图像约束的采样策略 | 
以下是使用传统 CFG 方法与 Dynamic Thresholding 技术的对比。在 Dynamic 模式中,设置了 mimic_scale=4.0 和 threshold_percentile=0.9。可以明显看到,传统方式下不同 CFG 值间的输出差异较大,尤其在 cfg=25.0 时,色彩出现严重偏差。而采用 Dynamic Thresholding 后,由于 mimic_scale 被设定为 4.0,即使实际 cfg 值较高,最终输出仍会被动态调节至接近 4.0 的分布,从而有效控制色彩平衡与一致性。

