comfyui_llm_party>☁️🖥️迷你高级OCR
comfyui_llm_party
时间:2025/11/03

☁️🖥️迷你高级OCR

“迷你高级OCR”节点用于从输入图片中识别并提取文字信息。它支持多语言识别和 GPU 加速,能够将图像中的文字转化为可编辑的文本或结构化数据,常用于文档数字化、票据识别、多语言场景处理等任务。
☁️🖥️迷你高级OCR-节点参数说明
输入参数
image输入的图像对象。
输出参数
images输出处理后的图像(可带标注信息)。
masksOCR 识别的掩码区域信息。
json_str识别结果的 JSON 格式,包含文字内容及位置信息。
text纯文本识别结果。
控件参数
gpu是否启用 GPU 加速,设为 true 时提升识别速度。
language_name识别的语言列表(如 ch_sim,en 表示简体中文 + 英文)。
model_name调用的模型名称(如 gpt-4o-mini)。
base_urlAPI 服务的基础地址,可配置代理或私有接口。
api_key调用服务的密钥,用于身份认证。
imgbb_api_key用于图像上传到图床的密钥,便于远程解析或调试。填入该信息后,该节点会将输入端输入的图片上传到图床。
is_enable控制节点是否启用,设为 False 时不会执行文字识别任务。

示例工作流

广告

可加入知识星球获取所有示例工作流

广告

微信扫码入群,加入AIGC大家庭,与大家一起交流学习