[发明专利]基于全局区域先验注意力的目标检测方法有效
申请号: | 202011365545.4 | 申请日: | 2020-11-28 |
公开(公告)号: | CN112381106B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 吴泽彬;龚航;徐伟;赵朝蓬;刘建新;陈圣堂;徐洋;陈刚;夏雷;顾涛;丁道华;晁京 | 申请(专利权)人: | 南京理工大学;中国铁路上海局集团有限公司南京供电段 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 全局 区域 先验 注意力 目标 检测 方法 | ||
1.一种基于全局区域先验注意力的目标检测方法,其特征在于,包括如下步骤:
步骤(A),遍历训练集,统计每个训练样本中目标出现的位置信息,得到全局区域先验注意力;
步骤(B),获取待检测图像,利用训练得到的特征提取网络对原图进行特征提取;
步骤(C),从主干网络中分支出自适应注意力网络分支,利用自适应注意力网络对全局区域先验注意力进行修正与增强,得到自适应全局区域先验注意力掩膜;将注意力掩膜点乘到特征图上,然后对特征图进行目标检测;
步骤(C)包括如下步骤:
(C1),从主干特征提取网络中的特征中提取特征作为全局区域先验注意力修正增强网络的输入;
(C2),将输入特征进行卷积、池化、反卷积获得更加抽象的语义信息;
(C3),将步骤(C2)的计算结果过一层sigmoid函数进行归一化,然后乘上全局区域先验注意力,对全局区域先验注意力进行增强与修正;
(C4),在步骤(C3)的计算结果上加上1,然后点乘到主干特征提取网络的特征上,对特征进行增强;其计算公式如下:
其中x为输入的特征,为卷积、池化、反卷积系列计算,为区域先验注意力,点乘上注意力修正增强网络中产生的掩膜,对区域先验注意力进行修正增强,在所有元素上加上1,最后点成到特征图上,对特征图进行增强,然后对特征图进行目标检测。
2.根据权利要求1所述的基于全局区域先验注意力的目标检测方法,其特征在于,步骤(A),遍历训练集,统计每个训练样本中目标出现的位置信息,得到全局区域先验注意力,包括如下步骤:
(A1),在训练样本图片中人工框选出目标所在的区域,获取训练样本图片中目标所在的目标区域的位置信息作为标签保存;
(A2),将训练样本图片与全局区域先验注意力缩放至所设定的尺寸;
(A3),初始化全局区域先验注意力每个值为零,遍历训练样本,将全局区域先验注意力中所有与训练样本图片的标签中所划定的区域同一位置的像素的像素值加1,得到全局区域先验注意力;
(A4),使用sigmoid函数对全局区域先验注意力进行归一化,得到全局区域先验注意力。
3.根据权利要求1所述的基于全局区域先验注意力的目标检测方法,其特点在于,所述步骤(B),获取待检测图像,利用训练得到的特征提取网络对原图进行特征提取,包括如下步骤:
(B1),使用双线性插值的方法将待检测图片缩放到同一个尺寸大小;
(B2),使用3*3的卷积核与1*1的卷积核,将输入值进行特征提取,最后生成13*13的多维矩阵,这将原图分割成13*13个网格,13*13共169个n维向量负责每个网格内的目标检测,其中包括分类信息,目标位置信息;
(B3),将训练样本中的标签信息处理成与网络输出对应的矩阵形式,并计算损失值,然后使用反向传播训练整个网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学;中国铁路上海局集团有限公司南京供电段,未经南京理工大学;中国铁路上海局集团有限公司南京供电段许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011365545.4/1.html,转载请声明来源钻瓜专利网。