WanImageToVideo

节点功能：该节点是将图像信息转为视频生成所需的条件信息（conditionings 和 latent）而设计的，是视频模型生成流程中的“起点节点”之一。它结合了图像提示、视觉引导、以及图像-to-latent 转换，输出用于后续采样器或视频模型的 positive、negative 和 latent。

输入参数

参数名称	说明
positive	正向提示词。
negative	反向提示词。
vae	编解码模型。
clip_vision_output	CLIP 视觉编码结果，可为图像提供语义感知条件。
start_image	起始图像序列，用作视频第一帧或前若干帧的图像。

输出参数

参数名称	说明
positive	更新后的正向条件，包含额外信息如起始图像 latent、clip vision 等。
negative	更新后的反向条件，结构同上。
latent	初始化的视频 latent 张量。

控件参数

参数名称	说明
width	视频帧宽度，必须是 16 的倍数。
height	视频帧高度，必须是 16 的倍数。
length	视频长度（帧数），默认 81。表示将生成多少帧，通常为偶数或 4 的倍数，影响生成视频时间长度与显存占用。
batch_size	一次生成的样本数量。

下图为万相图生视频ComfyUI官方示例工作流，通过该节点可以设置视频的尺寸以及帧数。