参数名称 | 说明 |
---|---|
block_swap_args | 包含卸载配置的字典结构,供 Wan 模型加载节点使用。 |
WanVideo BlockSwap
节点功能:该节点用于配置 Transformer 块交换(Block Swapping) 策略,以在使用 WanVideo 大模型(如 14B)时减少显存占用。通过将部分 Transformer 块、图像嵌入或文本嵌入在推理过程中转移到 CPU,可以显著节省 VRAM。
输出参数
控件参数
参数名称 | 说明 |
---|---|
blocks_to_swap | 需要被卸载(swap)的 Transformer 层数,14B 模型有 40 层,1.3B 模型有 30 层。建议设置为 10–25,根据显存情况决定;值越大节省显存越多但访问延迟越高。 |
offload_img_emb | 是否卸载图像 embedding 模块(img_emb)到 CPU。 |
offload_txt_emb | 是否卸载文本 embedding 模块(txt_emb)到 CPU。 |
use_non_blocking | 是否启用非阻塞内存传输,提高 swap 速度但会多占用系统内存。建议在内存充足的系统上启用此项,能显著提升推理响应时间。 |
vace_blocks_to_swap | 若使用 VACE 模型,设置需要 swap 的 VACE 层数(最多支持 15 层)。建议在使用 t2v 模型(含 vace_blocks)时设置为 6–10,默认 0 表示不卸载。 |
offload_img_emb和offload_txt_emb对显存的释放影响不是很大
blocks_to_swap=20
blocks_to_swap=10
blocks_to_swap 值越小,表示交换到 CPU 的 Transformer 块越少,更多计算保留在 GPU 上,推理速度更快,但显存占用也相应增加。
blocks_to_swap=20,use_non_blocking=False
该节点的参数调整主要在于如何设置blocks_to_swap,其他参数使用默认就行