comfyui_llm_party
时间:2025/11/03
☁️🖥️迷你高级OCR
“迷你高级OCR”节点用于从输入图片中识别并提取文字信息。它支持多语言识别和 GPU 加速,能够将图像中的文字转化为可编辑的文本或结构化数据,常用于文档数字化、票据识别、多语言场景处理等任务。
☁️🖥️迷你高级OCR-节点参数说明
| 输入参数 | |
| image | 输入的图像对象。 |
| 输出参数 | |
| images | 输出处理后的图像(可带标注信息)。 |
| masks | OCR 识别的掩码区域信息。 |
| json_str | 识别结果的 JSON 格式,包含文字内容及位置信息。 |
| text | 纯文本识别结果。 |
| 控件参数 | |
| gpu | 是否启用 GPU 加速,设为 true 时提升识别速度。 |
| language_name | 识别的语言列表(如 ch_sim,en 表示简体中文 + 英文)。 |
| model_name | 调用的模型名称(如 gpt-4o-mini)。 |
| base_url | API 服务的基础地址,可配置代理或私有接口。 |
| api_key | 调用服务的密钥,用于身份认证。 |
| imgbb_api_key | 用于图像上传到图床的密钥,便于远程解析或调试。填入该信息后,该节点会将输入端输入的图片上传到图床。 |
| is_enable | 控制节点是否启用,设为 False 时不会执行文字识别任务。 |

