Diffusers MV Sampler

节点功能:该节点是一个用于生成多视角图像的节点,它可以让你只用一句提示词(prompt),就自动生成从不同角度(比如正面、左侧、右后方等)观察同一个物体或场景的多张图片。你只需要输入想生成的内容、负面提示词(比如排除水印、模糊等),以及生成图像的分辨率、采样步数、随机种子等参数,它就会通过一个支持多视角控制的 Stable Diffusion 模型 pipeline,结合内部模拟的“相机视角控制信息”,一次性生成多张角度不同但内容一致的图像。它还支持引入参考图(保持风格一致)和 ControlNet 图(保持结构一致),以增强生成效果。比如你输入“一个骑在马上的宇航员”,它可以帮你生成从正面、左侧、右侧、后侧等角度观察到的宇航员形象,适合做角色设计、三维建模素材准备、360°多角度展示等用途。

输入参数

参数名称说明
pipeline加载的多视角(Multi-View)Diffusers 推理管道,通常来自 DiffusersMVPipelineLoader。
reference_image用于提示样式或外观的参考图像(可选)。
controlnet_image提供 ControlNet 约束的图像,如姿态、深度图、轮廓等(可选)。
azimuth_degrees控制每个视角的方位角度(单位:度),例如 [0, 45, 90, ...]。

输出参数

参数名称说明
IMAGE多视角生成的图像,形状为 [num_views, C, H, W]。

控件参数

参数名称说明
num_views生成图像的视角数量,最大支持 12,实际生成图像数量由 len(azimuth_degrees) 决定,而不是 num_views。
prompt正向文本提示词,用于指导生成内容。
negative_prompt负向文本提示词,用于避免不希望出现的内容。
width输出图像的宽度(像素)。
height输出图像的高度(像素)。
steps扩散采样步数。
cfg文本引导强度(Classifier-Free Guidance)。
seed随机种子,用于控制可重复性。
controlnet_conditioning_scaleControlNet 引导强度。

下图所示为该节点的用法,通过参考图像和扩散模型进行图像的多视角生成,可以根据提示词给出相应的控制信息,或者改变种子多次抽卡完成不同的效果渲染。

下图所示为控制图像作为输入生成多视角图像的示例工作流,根据提示词的内容和预处理图的控制完成自定义角色的生成。

下图为通过ViewSelector节点选择不同的相机输出视角,根据提示词完成图像的生成,该节点会覆盖nun_views的设置,下图所示为开启四个角度的图像,最终生成4张。