CosmosImageToVideoLatent

节点功能：CosmosImageToVideoLatent用于将起始图像和结束图像编码成视频latent，并自动填充中间latent，同时生成一个noise mask 来告诉后续模型哪些部分是“需要采样”的。使用 VAE 将起始图像 (start_image) 和/或结束图像 (end_image) 编码成latent，填入latent视频张量对应位置，其余部分留空（保留为 0 或加 noise），生成一个用于视频扩散模型的初始化latent。

输入参数

参数名称	说明
vae	用于编码图像的 VAE 模型。
start_image	起始图像（可选）。
end_image	结束图像（可选）。

输出参数

参数名称	说明
LATENT	生成的视频潜在图像（latent video）。

控件参数

参数名称	说明
width	视频图像的宽度，默认 1280，范围 16 到 MAX_RESOLUTION，步长 16。
height	视频图像的高度，默认 704，范围 16 到 MAX_RESOLUTION，步长 16。
length	视频长度，默认 121，范围 1 到 MAX_RESOLUTION，步长 8。
batch_size	批处理大小，默认 1，范围 1 到 4096。

下图为起始帧控制完成视频生成的示例工作流。