[发明专利]一种基于无锚点级联检测的无人机图像车辆目标识别方法在审

专利信息
申请号: 202111654281.9 申请日: 2021-12-30
公开(公告)号: CN114419433A 公开(公告)日: 2022-04-29
发明(设计)人: 胡馨之;潘勉;吕帅帅;金建国;唐金龙 申请(专利权)人: 杭州电子科技大学
主分类号: G06V20/10 分类号: G06V20/10;G06V10/764;G06V10/80;G06K9/62
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 朱月芬
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 无锚点 级联 检测 无人机 图像 车辆 目标 识别 方法
【权利要求书】:

1.一种基于无锚点级联检测的无人机图像车辆目标识别方法,其特征在于,包括以下步骤:

S1:选取数据集;

采用现有的UAVDT数据集作为本方法的数据集,对模型进行训练;

S2:采用Resnet50对输入的原始图片进行特征提取,获得多尺度的特征图;

S3:依次将S2中输出的高层特征图进行两倍上采样,并与S2中的低层特征图相加,得到融合后的特征图;为了使后续的检测模块能够拥有更多尺度的特征,将融合后的特征图中的最上层特征图进行连续两倍下采样,得到扩展的两层特征图;最后得到一个自顶向下的金字塔结构的多尺度融合后的特征图;

S4:对S3处理后的特征图进行级联检测;

S5:划分正负样本;对于金字塔结构的每一层特征图,在S4得到的结果的基础上,计算其每个点的适应度,并将所有适应度的值统计得到全局阈值,高于阈值的为正样本,否则为负样本;

S6:检测目标的类别与位置;

根据需要选用合适的无锚点检测器;将特征图分别输入分类、回归两个子网络,在S5得到的正样本上,对检测结果进行进一步调整;将预测框输入归回网络,调整框的位置,并计算预测框的类别置信度,置信度较高的类别即为目标的类别;最后使用非极大值抑制,在众多预测框中保留单个类别中检测结果最好的一个,得到最后的检测结果。

2.根据权利要求1所述的一种基于无锚点级联检测的无人机图像车辆目标识别方法,其特征在于,S2详细步骤为:

使用Resnet50作为特征提取模块的主干,提取原始图片的特征;Resnet50共有五个阶段,每个阶段都会输出一个特征图,同时也是下一阶段的输入;不同阶段输出的特征图尺度不同,越上层的特征图,尺度越小,通道数越多;

首先将输入的原始图片进行处理,具体过程如下:

Out=Conv7×7(C,W,H,k,s)#(1)

其中Out代表第一阶段输出的特征图,Conv7×7代表大小为7×7的卷积层,C表示输入的图片的通道数,RGB图像的通道数为3,W,H分别代表输入图片的宽和高,k表示卷积核的大小,s代表卷积核移动的步长;其中k=64,s=2;

其次对输出的特征图依次进行特征提取,具体过程如下:

Pi=Conv3×3(Ci,W,H,ki,si)#(2)

其中,Pi为第i阶段输出的特征图,Conv3×3表示大小为3×3的卷积层,Ci表示第i阶段输入的特征图的通道数,W,H分别代表输入特征图的宽和高;ki表示卷积核的大小,其中ki=256×2i-1;si代表卷积核移动的步长,si=2;最后输出四个特征图,自下而上分别为{P2,P3,P4,P5},通道数分别为{256,512,1024,2048}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111654281.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top