TextEncodeHunyuanVideo

TextEncodeHunyuanVideo_ImageToVideo

节点功能： TextEncodeHunyuanVideo_ImageToVideo 节点是为图转视频（Image-to-Video）任务中使用文本+图像混合引导的扩散模型而设计的编码器节点。它属于混合提示控制节点，结合图像感知结果和文本 prompt，以更精确地控制视频内容生成。将输入图像的视觉特征（来自 CLIP Vision）与用户输入的文本 prompt 融合成统一的 CONDITIONING 条件，用于引导图像到视频的扩散生成过程。

输入参数

参数名称	说明
clip	多模态 CLIP 模型，支持文本和视觉嵌入联合编码。
clip_vision_output	图像特征输出，通常来自 CLIPVisionEncode。

输出参数

参数名称	说明
CONDITIONING	混合图像语义与文本语义后的条件输入结构。

控件参数

参数名称	说明
prompt	文字提示，描述生成视频的主题、动作等。
image_interleave	图像与文本嵌入交叉融合频率。值越大 → 文本主导；值越小 → 图像主导。

下图为测试示例工作流，输入文本结合hunyuan模型完成视频生成，需要上传第一张参考图像。