WanVideo Diffusion Forcing Sampler

节点功能:专为 文本到视频(T2V) 和 视频到视频(V2V) 生成设计的 高级扩散采样器,通过多模态条件控制(文本/图像嵌入、动作引导、时序噪声调节)生成高质量视频。支持 长序列生成优化

输入参数

参数名称说明
model用于采样的主视频扩散模型。
text_embeds文本编码,包含正向与负向提示词 embedding。
image_embeds图像引导信息,包含 latent、clip context、帧结构等。
samples初始 latent(用于视频到视频 v2v 生成)。
prefix_samples先行帧 latent(用于控制视频前缀,如 Skyreels 预设帧)。
teacache_args启用 TeaCache 缓存机制,减少重复计算。
slg_args指定哪些 transformer 块使用 SLG 局部细化策略。
experimental_args包含 Fresca、CFG-Zero-Star 等实验特性配置。Fresca:一种频域滤波技术,通过低频增强、高频抑制的方式优化生成图像的平滑性与细节清晰度。主要参数包括: • fresca_scale_low:低频部分增强倍数,默认 1.0; • fresca_scale_high:高频部分增强倍数,默认 1.25; • fresca_freq_cutoff:频率截断点,影响滤波边界,默认 20。 CFG-Zero-Star:一种改进版 Classifier-Free Guidance,自动调节正向与负向引导之间的比例 α,以增强结构对齐与提示控制。主要参数包括: • cfg_zero_star:是否启用此机制; • zero_star_steps:启用步数阈值,在前 N 步应用零初始化策略以抑制初期噪声干扰。
unianimate_poses提供姿态信息的三维 pose 数据(如 dwpose),用于 UniAnimate 引导。

输出参数

参数名称说明
samples扩散采样后的视频 latent 表示。可用于后续解码或 VAE 输出为图像序列。

控件参数

参数名称说明
addnoise_condition初始参考帧添加噪声的程度,增强长视频一致性。
fps生成视频的帧率。范围 1~120。
steps扩散步数,越大细节越丰富。
cfg提示词引导系数。
shift调度器时间偏移,用于不同调度器的时间控制。
seed随机数种子。
force_offload采样后是否将模型卸载至 offload_device,节省显存。
scheduler调度器名称。
denoise_strength去噪强度。0~1,越小代表越强的初始图保留。
rope_functionRoPE 实现方式,支持 default 与 comfy。建议使用 comfy,便于加速与编译优化。

该节点和WanVideo Sampler节点的关键区别在于prefix_samples参数,它可以连接之前生成的视频作为输入,再进一步采样,从而达到生成长视频的目的。并且该节点只能搭配skyreels V2 模型使用。

其他参数大多在WanVideo Sampler节点中提过了,这里重点测试addnoise_condition参数,该参数仅在存在 prefix_samples时生效。

这里prefix_samples代表的是前一段生成的视频,addnoise_condition值越小,则和前段视频的一致性更强,但过小容易没有变化,导致生成的视频静态。