Diffusers MV Model Makeup

节点功能:这个节点的作用是“给你的 Stable Diffusion pipeline 装配多视角能力”:它加上 VAE 编码器、调度器,还能加载一个 MV-Adapter 模块,使你的模型可以从不同角度生成同一个物体或场景的图像,最终输出一个可以用于 DiffusersMVSampler 的强大 pipeline(总信息)。在adapter_name参数中有很多的可选模型,区别可对比下表。enable_vae_slicing 和 enable_vae_tiling 都是为了节省显存、加速推理的优化手段,作用于 VAE 解码器阶段,但它们使用的方式不同:slicing是从通道的层面完成显存的节省,常见的比如jpg图像有rgb三通道,而tiling是直接对图像进行分块采样处理,这个方式在SDupscale,supir高清放大等很多方法中用到。

输入参数

参数名称说明
pipeline基础推理管道,通常由 DiffusersMVPipelineLoader 提供。
scheduler采样调度器(如 DDIM、DPM++ 等),用于控制采样策略。
autoencoder编码/解码模块(VAE),控制图像和 latent 空间的转换。

输出参数

参数名称说明
PIPELINE注入 Scheduler、VAE、MVAdapter 后的新推理管道,供后续 DiffusersMVSampler 使用。

控件参数

参数名称说明
load_mvadapter是否加载多视角适配器(MVAdapter)。
adapter_pathHuggingFace 仓库路径或本地路径,如 "huanngzh/mv-adapter"。
adapter_name适配器文件名,如 mvadapter_t2mv_sdxl.safetensors。
num_views多视角适配器支持的最大视角数量(通常是 6、8、12 等)。
enable_vae_slicing是否启用 VAE slicing 技术,节省显存(默认开启)。
enable_vae_tiling是否启用 VAE tiling,支持大图拼块处理(默认关闭)。

下图为示例工作流用法,通过一张图像生成多视角图像。


爆显存的时候可以把enable_vae_slicing和enable_vae_tiling都打开

load_mvadapter设置为false,并使用StableDiffusionXLPipeline后,只有图像的单视角图,这里是6张图,因为num_views=6,这6张图并没有一致性控制。