
PixmindImage
100
Prompt
本文提出的输电线路异物入侵检测方法,是一个将微调后的SAM大模型与CLIP模型级联的框架,其整体的推理流程图如图1所示。该框架以输电线路巡检图像作为输入,首先经过预处理模块进行尺寸归一化等图像调整。随后,输入图像被送入微调后的SAM模块,根据提示将目标物体分割生成高精度的掩码。分割得到的区域接着被送入CLIP类别识别模块,CLIP模型进行零样本图像文本匹配,对区域内的物体进行分类识别。最后,一个几何特征过滤模块作为后处理的优化策略,通过利用目标的几何形状特征如长宽比对高压线、烟雾等的检测结果进行验证与修正,最终输出带有类别标签与mIou的检测结果。 根据这个思路建一个学术级流程图放进论文里边
Aspect Ratio: 4:3Output Dimension: 1440x1080
