WanVideo BlockSwap

节点功能:该节点用于配置 Transformer 块交换(Block Swapping) 策略,以在使用 WanVideo 大模型(如 14B)时减少显存占用。通过将部分 Transformer 块、图像嵌入或文本嵌入在推理过程中转移到 CPU,可以显著节省 VRAM。

输出参数

参数名称说明
block_swap_args包含卸载配置的字典结构,供 Wan 模型加载节点使用。

控件参数

参数名称说明
blocks_to_swap需要被卸载(swap)的 Transformer 层数,14B 模型有 40 层,1.3B 模型有 30 层。建议设置为 10–25,根据显存情况决定;值越大节省显存越多但访问延迟越高。
offload_img_emb是否卸载图像 embedding 模块(img_emb)到 CPU。
offload_txt_emb是否卸载文本 embedding 模块(txt_emb)到 CPU。
use_non_blocking是否启用非阻塞内存传输,提高 swap 速度但会多占用系统内存。建议在内存充足的系统上启用此项,能显著提升推理响应时间。
vace_blocks_to_swap若使用 VACE 模型,设置需要 swap 的 VACE 层数(最多支持 15 层)。建议在使用 t2v 模型(含 vace_blocks)时设置为 6–10,默认 0 表示不卸载。

offload_img_emboffload_txt_emb对显存的释放影响不是很大

blocks_to_swap=20

blocks_to_swap=10

blocks_to_swap 值越小,表示交换到 CPU 的 Transformer 块越少,更多计算保留在 GPU 上,推理速度更快,但显存占用也相应增加。


blocks_to_swap=20,use_non_blocking=False

该节点的参数调整主要在于如何设置blocks_to_swap,其他参数使用默认就行