comfyui_llm_party>💻EasyOCR高级
comfyui_llm_party
时间:2025/11/03

💻EasyOCR高级

“EasyOCR高级”节点用于对输入的图片进行光学字符识别(OCR),并提供丰富的参数调节选项以优化识别效果。它支持多语言识别、段落模式、图像预处理调节,适用于复杂文档识别、低质量图像文字提取、精细化OCR调优等场景。
💻EasyOCR高级-节点参数说明
输入参数
image输入的图片对象。
输出参数
images图像对象,可带标注信息。
masks文字区域掩码。
json_strOCR 结果的 JSON 格式,包含文字及坐标。
text识别得到的纯文本。
language_list_help输出语言的缩写清单。
控件参数
gpu是否启用 GPU 加速,true 时可提升识别速度。
language_name需要识别的语言列表(如 ch_sim,en 表示简体中文和英文)。
decoder解码器类型(如 greedy、beamsearch),影响识别准确性和速度。
beamWidth束宽搜索参数,数值越大准确率越高但速度更慢。
batch_size批处理大小,影响并行处理性能。
workers并发工作线程数,适合大规模处理任务。
allowlist允许识别的字符集。
blocklist屏蔽的字符集。
paragraph是否启用段落模式,true 表示按段落输出。
min_size最小检测文字尺寸,过小的文字会被忽略。
contrast_ths对比度阈值,用于区分文字与背景。
adjust_contrast对比度调整强度。
text_threshold文字置信度阈值,过滤低质量识别结果。
low_text低文字检测阈值,调低可识别更模糊文字。
link_threshold字符连通性阈值,影响分词结果。
canvas_size图像在处理前的缩放尺寸(默认 2560)。
mag_ratio图像放大比例,增强小字体识别。
slope_ths斜率阈值,调整倾斜文字的检测能力。
ycenter_ths文字中心对齐阈值。
height_ths高度比阈值,过滤异常文字块。
width_ths宽度比阈值,过滤异常文字块。
add_margin在检测框周围增加边距,提高截取完整度。
is_enable控制节点是否启用,设为 False 时不会执行文字识别任务。

示例工作流

广告

可加入知识星球获取所有示例工作流

广告

微信扫码入群,加入AIGC大家庭,与大家一起交流学习