CosmosImageToVideoLatent

节点功能:CosmosImageToVideoLatent用于将起始图像和结束图像编码成视频latent,并自动填充中间latent,同时生成一个noise mask 来告诉后续模型哪些部分是“需要采样”的。使用 VAE 将起始图像 (start_image) 和/或结束图像 (end_image) 编码成latent,填入latent视频张量对应位置,其余部分留空(保留为 0 或加 noise),生成一个用于视频扩散模型的初始化latent。

输入参数

参数名称说明
vae用于编码图像的 VAE 模型。
start_image起始图像(可选)。
end_image结束图像(可选)。

输出参数

参数名称说明
LATENT生成的视频潜在图像(latent video)。

控件参数

参数名称说明
width视频图像的宽度,默认 1280,范围 16 到 MAX_RESOLUTION,步长 16。
height视频图像的高度,默认 704,范围 16 到 MAX_RESOLUTION,步长 16。
length视频长度,默认 121,范围 1 到 MAX_RESOLUTION,步长 8。
batch_size批处理大小,默认 1,范围 1 到 4096。

下图为起始帧控制完成视频生成的示例工作流。