参数名称 | 说明 |
---|---|
clip | 多模态 CLIP 模型,支持文本和视觉嵌入联合编码。 |
clip_vision_output | 图像特征输出,通常来自 CLIPVisionEncode。 |
TextEncodeHunyuanVideo_ImageToVideo
节点功能: TextEncodeHunyuanVideo_ImageToVideo 节点是为 图转视频(Image-to-Video)任务中使用文本+图像混合引导的扩散模型 而设计的编码器节点。它属于混合提示控制节点,结合图像感知结果和文本 prompt,以更精确地控制视频内容生成。将输入图像的视觉特征(来自 CLIP Vision)与用户输入的文本 prompt 融合成统一的 CONDITIONING 条件,用于引导图像到视频的扩散生成过程。
输入参数
输出参数
参数名称 | 说明 |
---|---|
CONDITIONING | 混合图像语义与文本语义后的条件输入结构。 |
控件参数
参数名称 | 说明 |
---|---|
prompt | 文字提示,描述生成视频的主题、动作等。 |
image_interleave | 图像与文本嵌入交叉融合频率。 值越大 → 文本主导;值越小 → 图像主导。 |
下图为测试示例工作流,输入文本结合hunyuan模型完成视频生成,需要上传第一张参考图像。