参数名称 | 说明 |
---|---|
source_embeds | 视频生成初始使用的文本嵌入,通常由 Prompt 文本经文本编码器生成。 |
source_image_embeds | 提供源图像的附加引导信息(如参考图、相机控制信息等)。 |
WanVideo FlowEdit
输入参数
输出参数
参数名称 | 说明 |
---|---|
flowedit_args | 封装 FlowEdit 参数的字典结构,供 WanVideoSampler 使用。 |
控件参数
参数名称 | 说明 |
---|---|
skip_steps | FlowEdit 跳过的前几个扩散步骤。值越大,保留初始视频结构的比例越高。 |
drift_steps | 在跳过步骤之后,用 drift prompt 替换源 prompt 的步数。 |
drift_flow_shift | 控制 drift prompt 替代过程中条件信息的转移强度,越大替换越剧烈。推荐 2.0~6.0,值大容易引入抖动但也能显著改变生成内容。 |
source_cfg | 原始的提示词引导系数。 |
drift_cfg | drift prompt 的引导强度。用于后期变化时的内容控制精度。 |
关于flow edit原理,大家可跳转B站啦啦啦的小黄瓜观看ComfyUI万相视频配合FlowEdit完成视频转绘
这里通过输入的图片使用flowedit对人物行转绘。
skip_steps在生成过程中跳过前面的若干步,不使用生成器干预,从而让运动或结构更稳定或自然
- 0:每一帧都强控制,可能 prompt 表现力强,但帧跳动大,动作幅度大。
- 2~4:控制较平衡,适合结构不复杂的视频。
- 8~12:控制弱,连贯性高,适合风格流畅或背景一致的视频。
这里skip_steps=2表情更倾向于上面的输入原视频,而skip_steps=8则有些脱离上面输入的图片了。
drift_steps 控制 何时从“主 prompt 阶段”过渡到“漂移阶段”。它不控制引导强度本身,而是控制 source_cfg 向 drift_cfg 的“切换时机”。
source_cfg控制在视频生成的主要阶段,模型对主 prompt(source_embeds)的“听话程度”。数值越高,生成画面越贴合源prompt;数值越低,画面越自由,可能更流畅但语义偏移。
drift_cfg,在 drift_steps 之后生效,控制模型对 原始 prompt(或 source_embeds) 的保留程度。数值越高,仍旧维持 prompt 语义;数值越低,则画面更自由、更梦幻,甚至出现抽象演化。
举个例子:
- source_cfg = 7.0
- drift_cfg = 3.0
- drift_steps = 12
那视频的生成流程大致像这样:
- 第 0 ~ 11 步:使用 source_cfg=7.0,画面严格跟随你的 prompt,比如一个写实人物场景;
- 第 12 步之后:进入“漂移阶段”,使用 drift_cfg=3.0,模型开始放松语义约束,更自由地变化画面,可能出现场景转变、人物风格漂移、光影流动等梦幻感。
时间轴steps →
[skip_steps] [drift_steps]
↓ ↓
|---|==============|===========|
↑ source_cfg ↑ drift_cfg
↑ drift_flow_shift 控制变化幅度
当 drift_steps 越大时,source_cfg 的作用持续时间越长,视频生成过程将更强地跟随源视频或输入条件,稳定性更高;反之,当 drift_steps 越小,drift_cfg 开始得越早,模型更早进入漂移阶段,画面就越发散。如果 drift_cfg 本身也设置得较低,则引导力进一步减弱,生成内容将更加自由甚至不可控。
drift_flow_shift也是在 drift_steps 之后生效,用于控制视频帧之间的“视觉流动”或“内容变化”强度,数值越高,变化越大、越自由;数值越低,变化平稳、接近原始 prompt 风格,即输入视频风格。
- 1.0~2.0:微弱变化、几乎稳定适合慢动作、时间静止感
- 3.0~7.0:中度变化,柔和流动常规过渡、风格转场
- 8.0~10.0+:剧烈变化,运动感强场景爆炸、人物/物体扭曲、梦境感或抽象化演化
还有就是,原本工作流中的WanVideo ImageClip Encode节点(红框)是可以被绿框内的两个节点代替的,且功能更多。本身WanVideo ImageClip Encode节点也被作者标为了Deprecated,如果哪天被作者删除了,则可以使用这两个节点。