使用该模型,首先要获取Google Gemini API,从Google AI Studio上申请 API key ,获取到API key后需要在下图中的文件中填入API key。
填完API key后保存,人后将该文件重命名为api_key.ini
填入提示词glasses,显示带有标注框的图像。
| 输入参数 | |
| image | 输入图像列表。支持批量输入多张图像。 |
| 输出参数 | |
| bboxes | 每张图像的检测框列表(格式为标准化 [x1,y1,x2,y2])。 |
| preview | 绘制了检测框的可视化图像结果,用于预览。 |
| 控件参数 | |
| model | 选择使用的 Gemini 模型版本。包含 "gemini-1.5-flash"、pro 等。 |
| prompt | 用于指定检测目标的文本提示,例如 "cat" 或 "人物"。 |
使用该模型,首先要获取Google Gemini API,从Google AI Studio上申请 API key ,获取到API key后需要在下图中的文件中填入API key。
填完API key后保存,人后将该文件重命名为api_key.ini
填入提示词glasses,显示带有标注框的图像。

可加入知识星球获取所有示例工作流

微信扫码入群,加入AIGC大家庭,与大家一起交流学习