WanImageToVideo

节点功能:该节点是将图像信息转为视频生成所需的条件信息(conditionings 和 latent) 而设计的,是视频模型生成流程中的“起点节点”之一。它结合了图像提示、视觉引导、以及图像-to-latent 转换,输出用于后续采样器或视频模型的 positive、negative 和 latent。

输入参数

参数名称说明
positive正向提示词。
negative反向提示词。
vae编解码模型。
clip_vision_outputCLIP 视觉编码结果,可为图像提供语义感知条件。
start_image起始图像序列,用作视频第一帧或前若干帧的图像。

输出参数

参数名称说明
positive更新后的正向条件,包含额外信息如起始图像 latent、clip vision 等。
negative更新后的反向条件,结构同上。
latent初始化的视频 latent 张量。

控件参数

参数名称说明
width视频帧宽度,必须是 16 的倍数。
height视频帧高度,必须是 16 的倍数。
length视频长度(帧数),默认 81。表示将生成多少帧,通常为偶数或 4 的倍数,影响生成视频时间长度与显存占用。
batch_size一次生成的样本数量。

下图为万相图生视频ComfyUI官方示例工作流,通过该节点可以设置视频的尺寸以及帧数。