[发明专利]一种基于卷积神经网络的注意力目标识别方法有效
申请号: | 201810849427.7 | 申请日: | 2018-07-28 |
公开(公告)号: | CN109086779B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 冀中;孔乾坤;李晟嘉 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的一种基于卷积神经网络的注意力目标识别方法,通过对卷积神经网络的不同层次的特征图进行特征增强以及特征注意力两大处理,从而获得更加具有表征目标物体能力的特征图,然后将所得的特征图分别进行目标检测操作,这样既保留了浅层特征图中的小目标信息,也保留了深层特征中的大目标信息,使得特征图更加具有表征目标物体的能力,作为一种单阶段目标检测器,在保证目标检测效率的同时,大大提升了目标检测的精度。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 注意力 目标 识别 方法 | ||
【主权项】:
1.一种基于卷积神经网络的注意力目标识别方法,其特征在于,包括如下步骤:1)通过卷积神经网络获取图像的特征,分别得到C3特征图、C4特征图和C5特征图;2)对所得的C3特征图、C4特征图和C5特征图分别采用1*1的卷积核,进行步长为1,卷积核通道数目为256的卷积操作,卷积操作后分别对应得到P3特征图、P4特征图和P5特征图;3)对步骤2)得的P3特征图、P4特征图和P5特征图分别进行特征增强处理;4)对P5特征图采用3*3的卷积核,进行步长为2,卷积核通道数目为256的卷积操作,得到P6特征图,对P6特征图与本身的元素对应相乘,得到特征增强后的P6*特征图;5)对P6特征图采用设定的激活函数对所得特征进行激活操作,然后采用3*3的卷积核,进行步长为2,卷积核通道数目为256的卷积操作,得到P7特征图,将P7特征图与本身对应元素相乘,得到特征增强后的P7*特征图;6)将P5′特征图经过两层卷积层,卷积核是1*1,步长为1,卷积核的通道数目为256,进行卷积操作后,再采用Sigmoid激活函数进行激活操作,得到的结果与P4特征图对应元素进行相乘,即实现了对特征的注意力操作,得到P8特征图;7)将P4′特征图经过两层卷积层,卷积核是1*1,步长为1,卷积核的通道数目为256,进行卷积操作后,再采用Sigmoid激活函数进行激活操作,得到的结果与P3特征图对应元素进行相乘,即实现了对特征的注意力操作,得到P9特征图;8)对所得的P3*特征图、P4*特征图、P5*特征图、P8特征图和P9特征图分别采用3*3的卷积核,进行步长为1,卷积核通道数目为256的卷积操作,卷积操作后分别对应得到F3特征图、F4特征图、F5特征图、F8特征图、F9特征图;9)对所得的F3特征图、F4特征图、F5特征图、P6*特征图、P7*特征图、F8特征图和F9特征图,分别进行候选框采样,采样间隔依次对应为8、16、32、64、128、16、8,采样面积大小依次对应为32*32、64*64、128*128、256*256、512*512、64*64、32*32,候选框的长宽比选取为1:1和1:2和2:1三种比例,对得到的候选框分别判断是否含目标物体,将含目标物体的候选框分别进行分类和坐标回归处理,完成对目标的识别;10)采用交叉熵损失函数和smoothL1函数通过反向传播,对卷积核的参数进行优化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810849427.7/,转载请声明来源钻瓜专利网。