[发明专利]一种基于轻量化网络的无人机影像车辆检测方法及装置有效
申请号: | 202010573599.3 | 申请日: | 2020-06-22 |
公开(公告)号: | CN111860175B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 孙显;刁文辉;付琨;许滔;尹文昕;李浩;王佩瑾;刘迎飞 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G08G1/01 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量化 网络 无人机 影像 车辆 检测 方法 装置 | ||
1.一种基于轻量化网络的无人机影像车辆检测方法,其特征在于,所述方法包括:
获取无人机的机载摄像头采集的目标区域图像,并对所述目标区域图像进行预处理;
将预处理后的目标区域图像输入至预先训练的轻量化检测网络,获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果;
采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选,获取目标区域的最终车辆检测结果;
所述预先训练的轻量化检测网络的获取过程包括:
步骤1.获取无人机的机载摄像头采集的实景图像数据,并对所述实景图像数据中图像进行预处理;
步骤2.人工标注所述实景图像数据中图像中车辆的车辆类别和矩形边界框;
步骤3.对所述实景图像数据进行数据增强,并将增强后的实景图像数据划分为训练数据和测试数据;
步骤4.利用所述训练数据和测试数据对初始轻量化神经网络模型进行训练,并将训练完成的初始轻量化神经网络模型作为所述预先训练的轻量化检测网络;
所述初始轻量化神经网络模型包括:
第一特征提取单元,用于将输入图像依次经过2组3*3的标准卷积层,得到高256,宽256,通道数为64的特征图;
第二特征提取单元,用于将第一特征提取单元输出的特征图经过动态特征卷积块,得到高128,宽128,通道数为128的特征图;
第三特征提取单元,用于将第二特征提取单元输出的特征图经过自适应感受野模块,得到高128,宽128,通道数为128的特征图;
第四特征提取单元,用于将第二特征提取单元输出的特征图依次经过三组动态特征卷积块,分别获取各组动态特征卷积块输出的高64,宽64,通道数为256的特征图,高32,宽32,通道数为512的特征图和高16,宽16,通道数为512的特征图;
第五特征提取单元,用于将所述高16,宽16,通道数为512的特征图依次经过四组3*3的标准卷积,分别获取各3*3的标准卷积输出的高8,宽8,通道数为512的特征图,高4,宽4,通道数为256的特征图,高2,宽2,通道数为256的特征图和高1,宽1,通道数为256的特征图;
定位子网络,用于对所述高64,宽64,通道数为256的特征图,高32,宽32,通道数为512的特征图,高16,宽16,通道数为512的特征图,高8,宽8,通道数为512的特征图,高4,宽4,通道数为256的特征图,高2,宽2,通道数为256的特征图和高1,宽1,通道数为256的特征图进行逐像素预测,获取定位偏移值;
分类子网络,对所述高64,宽64,通道数为256的特征图,高32,宽32,通道数为512的特征图,高16,宽16,通道数为512的特征图,高8,宽8,通道数为512的特征图,高4,宽4,通道数为256的特征图,高2,宽2,通道数为256的特征图和高1,宽1,通道数为256的特征图进行逐像素预测,获取分类置信度;
所述动态特征卷积块,包括:
第一特征提取子单元,用于将输入特征图F0依次经过1*3和3*1的深度可分离卷积,获取特征图F1,其中,F1和F0的尺寸相同;
第二特征提取子单元,用于将F1经过全局最大池化得到特征图F1_M,并将F1经过全局平均池化得到特征图F1_A,其中,F1_M和F1_A的高宽尺寸均为1*1,通道数与F1相同;
第三特征提取子单元,用于将F1_M和F1_A沿通道维度进行拼接,得到特征向量F1_C,将F1_C拉直后依次送入两组全连接网络,得到特征F1_B,将F1_B经过Sigmoid函数输出激活值F1_BA,其中,F1_B的通道数量与F1_M的通道数量相同;
第四特征提取子单元,用于将激活值F1_BA与特征图F1相乘得到特征图F1_S,将特征图F1_S与特征图F1相加,得到特征图F2;
第五特征提取子单元,用于将特征图F2依次经过1*3和3*1的深度可分离卷积,获取特征图F3;
第六特征提取子单元,用于将特征图F3与特征图F0相加后经过一组3*3的标准卷积,得到高128,宽128,通道数为128的特征图。
2.如权利要求1所述的方法,其特征在于,所述预处理包括:
对图像进行裁切,并将裁切后的图像缩小至512*512;
其中,所述裁切过程中裁切窗口尺寸为720*720,裁切窗口的重叠尺寸为200像素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010573599.3/1.html,转载请声明来源钻瓜专利网。