下面是速度测试内容。
以下是quantization=disabled下视频生成时间
以下是quantization=fp8_e4m3fn_fast下视频生成时间,可以看到总体是比上面时间少的
左边是未经过量化disabled,右边则是fp8_e4m3fn_fast。差距并不是很大,不过这里使用的是llava_llama3_fp8_scaled.safetensors,手部细节不是很好
左边是使用llava_llama3_fp8_scaled.safetensors,右边是llava_llama3_fp16.safetensorsSafe。至少前几帧fp16比fp8的手部细节更好一些
使用fp16模型对比于fp8模型视频生成时间,差距也不是很大。