下图所示即可当作一个示例,后续的大型工作流也将是这样的分析思路,比如该阶段的输出可以当作下一个阶段的准备阶段,所以通过功能的增加,可以获得非常大型的工作流。
denoise控制去噪强度,如果denoise过低,那么对latent的变化就相对较小,如果是文生图的过程那么会因为去噪不干净导致最终的出图偏灰色,如果是图生图,那么会增加跟原图的相似程度。
CFG也会称为提示词引导系数,该值过高会导致去噪过程过于关注文本,最终出图毁坏或者细节过多,该值的选择取决于大模型的训练方式,常见的加速模型,比如lightning,hyper等,cfg设置在1-2即可,未作加速的模型cfg在6-7左右。
step为去噪的总步数,该值依然跟大模型的选择有关,加速模型一般为8-12,未加速模型一般在20-30左右,步数过高那么在后续的去噪过程基本不会影响结果,这跟sampler和scheduler相关,因为噪声的策略一般是在最接近尾声的时候,去噪强度更小。