EmptyLatentAudio

节点功能:EmptyLatentAudio 是一个用于 生成空白音频 latent 张量 的节点,适用于音频扩散模型(如 AudioLDM、MusicGen、AudioCraft 等)作为初始 latent 输入,类似于图像扩散模型中的空白 LATENT。

输出参数

参数名称说明
LATENT空白音频 latent 张量,结构为 [B, 64, L],其中 L 为帧长。

控件参数

参数名称说明
seconds指定生成音频 latent 对应的时长(单位:秒)。默认 47.6。用于控制 latent 长度,推荐范围 5~60 秒。必须为正数。
batch_size一次生成的 latent 数量,默认值为 1。

下图为音频测试示例工作流,生成音频速度很快,大家可以测试效果。