☁️🖥️迷你高级OCR

“迷你高级OCR”节点用于从输入图片中识别并提取文字信息。它支持多语言识别和 GPU 加速，能够将图像中的文字转化为可编辑的文本或结构化数据，常用于文档数字化、票据识别、多语言场景处理等任务。

☁️🖥️迷你高级OCR-节点参数说明

输入参数
image	输入的图像对象。
输出参数
images	输出处理后的图像（可带标注信息）。
masks	OCR 识别的掩码区域信息。
json_str	识别结果的 JSON 格式，包含文字内容及位置信息。
text	纯文本识别结果。
控件参数
gpu	是否启用 GPU 加速，设为 true 时提升识别速度。
language_name	识别的语言列表（如 ch_sim,en 表示简体中文 + 英文）。
model_name	调用的模型名称（如 gpt-4o-mini）。
base_url	API 服务的基础地址，可配置代理或私有接口。
api_key	调用服务的密钥，用于身份认证。
imgbb_api_key	用于图像上传到图床的密钥，便于远程解析或调试。填入该信息后，该节点会将输入端输入的图片上传到图床。
is_enable	控制节点是否启用，设为 False 时不会执行文字识别任务。

ComfyUI原生节点