[发明专利]基于滑动窗口的车底图片异物识别方法、装置及存储介质有效
申请号: | 202110588934.1 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113033720B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 赵荣;成晓龙;赵智玉;徐梅娟 | 申请(专利权)人: | 南京索安电子有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 王斌 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 滑动 窗口 车底 图片 异物 识别 方法 装置 存储 介质 | ||
本发明公开了一种基于滑动窗口的车底图片异物识别方法、装置及存储介质,车底图片异物识别方法包括如下步骤:步骤1,训练异物识别网络模型M,获得异物识别网络的参数;步骤2,采用滑动窗口将车底图片切分为多个窗口图像、多进程加载各窗口图像数据、对窗口图像进行预处理并输入异物识别网络M得到异物的识别结果。本发明通过多进程处理滑动窗口切分后的车底图片,并结合对于中等目标识别更稳定的基于锚框的方法和对于小目标识别更灵活的基于特征点的方法,有效提高了高分辨率车底异物识别的效率和准确度。
技术领域
本发明涉及一种高效的基于滑动窗口的高分辨率车底图片的小目标异物识别方法,属于异物识别技术领域。
背景技术
为了防止不法分子在车辆底盘藏匿枪支、炸药、毒品等危险物品,车辆底盘的异物识别是安全检查中的重要一环。现有的车底异物识别方法有拍摄高清车底图片并人工对图片进行检查,但是这种方法存在效率低、安检人员长期监视图片后判断准确率下降等缺陷。一种更加高效的安检方式为通过计算机视觉中基于深度学习的目标识别技术对车底图片进行分析,从而自动地识别出车底存在的异物。
安全检查系统拍摄的车底图片存在以下特点:第一,图片分辨率高。这导致图片识别过程的计算开销较大,耗时长,直接将高分辨率图片输入目标识别网络往往需要数十秒才能得到识别结果;第二,车底异物多为小目标,即异物占整个车底图片的比例较小。这使得通常的目标识别方法对异物的识别精度较低。
发明内容
本发明所要解决的技术问题是在车底图片分辨率较高,和车底异物为小目标的情况下,提高车底异物识别的效率和准确率。
为了解决上述问题,本发明采用以下技术方案:
一种基于滑动窗口的车底图片异物识别方法,其特征在于,包括以下步骤:
步骤1,训练异物识别网络模型M,获得异物识别网络的参数;
步骤2,采用滑动窗口将车底图片切分为多个窗口图像、多进程加载各窗口图像数据、对窗口图像进行预处理并输入异物识别网络M得到异物的识别结果。
步骤1包括:数据集的构建与划分、车底图片的预处理、异物识别网络的前向传播、异物识别网络的参数更新。
步骤1-1,收集包含异物的车底图片数据,包括车底图片以及对应的异物标注边界框和类别;将车底图片数据划分为训练集和验证集,然后将训练数据随机打乱并划分为多个小批次,验证集数据直接划分为多个小批次;
步骤1-2,对输入车底图片进行预处理,首先以长宽分别为h、w的窗口从输入车底图片中随机裁剪得到窗口图像,然后对窗口图像水平随机翻转并更新窗口图像对应的异物标注边框,最后对窗口图像进行归一化并转换为Pytorch 张量,将小批次内的数据拼接,得到异物识别网络M的输入数据;
步骤1-3,将步骤1-2预处理得到的数据输入异物识别网络M中的骨干网络,得到多尺度的特征图;
骨干网络可选用ResNet50骨干网络,得到C2、C3、C4、C5四个多尺度的特征图。
步骤1-4,将步骤1-3得到的多尺度特征图输入异物识别网络M中的特征金字塔网络,得到多个特征融合后的多尺度特征图;
多个特征分别为P2、P 3、P 4、P 5、P 6、P 7六个特征。
步骤1-5,在步骤1-4输出的每个特征图Pi上分配多种尺度以及长宽比的锚框,将特征图分别输入异物识别网络M中的基于锚框的预测网络和基于特征点的预测网络,得到每个锚框的分类值以及边框回归值,和每个特征点的分类值以及边框回归值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京索安电子有限公司,未经南京索安电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110588934.1/2.html,转载请声明来源钻瓜专利网。