- Self-Attention(结构)
- Self-Attention(时间)
- Cross-Attention(结构)
- Cross-Attention(时间)
它特别适用于 SVD / AnimateDiff / VideoComposer 等支持 .time_stack. 层结构的 UNet 模型,目的是控制生成视频帧时不同注意力通道对结构/时间信息的关注程度,从而实现时空解耦控制、风格强化、结构保留或干扰等效果。
这里以sdxl基础生图模型为例,测试了对比效果,跟默认参数相比变化相当的小。仅作为实验使用。