- 是高维语义特征,不是像素点;
- 一张 512x512 的图像可能会被压缩成 64x64x4 的 latent;
- 这个空间是由 VAE(变分自编码器) 学习得到的,它会尽量保留图像的关键信息,比如形状、颜色块、纹理等。
你可以理解为:
像素空间 = 图片的“原图”;潜空间 = 图片的“精简概括”版本,但对 AI 来说更容易理解和操作。
下图所示的默认文生图工作流当中,该节点负责提供纯噪声的潜空间图像。
下图所示为纯噪声的潜空间图像解码后的样子。
输出参数 | |
LATENT | 初始为空的 latent 图像张量。 |
控件参数 | |
width | 潜变量图像的宽度(像素),需为 8 的倍数。 |
height | 潜变量图像的高度(像素),需为 8 的倍数。 |
batch_size | 要生成的 latent 图像数量。 |
你可以理解为:
像素空间 = 图片的“原图”;潜空间 = 图片的“精简概括”版本,但对 AI 来说更容易理解和操作。
下图所示的默认文生图工作流当中,该节点负责提供纯噪声的潜空间图像。
下图所示为纯噪声的潜空间图像解码后的样子。
可加入知识星球获取所有示例工作流
微信扫码入群,加入AIGC大家庭,与大家一起交流学习