[发明专利]一种基于无锚点级联检测的无人机图像车辆目标识别方法在审
申请号: | 202111654281.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114419433A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 胡馨之;潘勉;吕帅帅;金建国;唐金龙 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/764;G06V10/80;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 无锚点 级联 检测 无人机 图像 车辆 目标 识别 方法 | ||
1.一种基于无锚点级联检测的无人机图像车辆目标识别方法,其特征在于,包括以下步骤:
S1:选取数据集;
采用现有的UAVDT数据集作为本方法的数据集,对模型进行训练;
S2:采用Resnet50对输入的原始图片进行特征提取,获得多尺度的特征图;
S3:依次将S2中输出的高层特征图进行两倍上采样,并与S2中的低层特征图相加,得到融合后的特征图;为了使后续的检测模块能够拥有更多尺度的特征,将融合后的特征图中的最上层特征图进行连续两倍下采样,得到扩展的两层特征图;最后得到一个自顶向下的金字塔结构的多尺度融合后的特征图;
S4:对S3处理后的特征图进行级联检测;
S5:划分正负样本;对于金字塔结构的每一层特征图,在S4得到的结果的基础上,计算其每个点的适应度,并将所有适应度的值统计得到全局阈值,高于阈值的为正样本,否则为负样本;
S6:检测目标的类别与位置;
根据需要选用合适的无锚点检测器;将特征图分别输入分类、回归两个子网络,在S5得到的正样本上,对检测结果进行进一步调整;将预测框输入归回网络,调整框的位置,并计算预测框的类别置信度,置信度较高的类别即为目标的类别;最后使用非极大值抑制,在众多预测框中保留单个类别中检测结果最好的一个,得到最后的检测结果。
2.根据权利要求1所述的一种基于无锚点级联检测的无人机图像车辆目标识别方法,其特征在于,S2详细步骤为:
使用Resnet50作为特征提取模块的主干,提取原始图片的特征;Resnet50共有五个阶段,每个阶段都会输出一个特征图,同时也是下一阶段的输入;不同阶段输出的特征图尺度不同,越上层的特征图,尺度越小,通道数越多;
首先将输入的原始图片进行处理,具体过程如下:
Out=Conv7×7(C,W,H,k,s)#(1)
其中Out代表第一阶段输出的特征图,Conv7×7代表大小为7×7的卷积层,C表示输入的图片的通道数,RGB图像的通道数为3,W,H分别代表输入图片的宽和高,k表示卷积核的大小,s代表卷积核移动的步长;其中k=64,s=2;
其次对输出的特征图依次进行特征提取,具体过程如下:
Pi=Conv3×3(Ci,W,H,ki,si)#(2)
其中,Pi为第i阶段输出的特征图,Conv3×3表示大小为3×3的卷积层,Ci表示第i阶段输入的特征图的通道数,W,H分别代表输入特征图的宽和高;ki表示卷积核的大小,其中ki=256×2i-1;si代表卷积核移动的步长,si=2;最后输出四个特征图,自下而上分别为{P2,P3,P4,P5},通道数分别为{256,512,1024,2048}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111654281.9/1.html,转载请声明来源钻瓜专利网。