[发明专利]一种基于多卷积融合网络的目标检测方法及系统有效
申请号: | 202110707169.0 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113255589B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陈克鹏 | 申请(专利权)人: | 北京电信易通信息技术股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
地址: | 100097 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 融合 网络 目标 检测 方法 系统 | ||
1.一种基于多卷积融合网络的目标检测方法,其特征在于,包括:
将通过无人机携带的摄像头采集的交通枢纽中来往车辆的图像数据作为数据集;
构建用于图像目标检测的网络结构;
根据所述数据集训练所述用于图像目标检测的网络结构,获得图像目标检测模型;
利用所述图像目标检测模型,对待检测图像数据进行目标检测;
所述用于图像目标检测的网络结构包括:ResNet101网络、多卷积融合网络、区域生成网络、ROI池化层和检测头;
所述ResNet101网络包括依次连接的第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块和第五卷积模块;所述多卷积融合网络包括第一多卷积融合模块、第二多卷积融合模块、第三多卷积融合模块、第四多卷积融合模块和第五多卷积融合模块;
所述第一多卷积融合模块、所述第二多卷积融合模块、所述第三多卷积融合模块、所述第四多卷积融合模块和所述第五多卷积融合模块均用于对输入的图像进行多卷积特征融合;
所述第五卷积模块的输出连接所述第五多卷积融合模块的输入,所述第四卷积模块的输出连接所述第四多卷积融合模块的输入,所述第三卷积模块的输出连接所述第三多卷积融合模块的输入,所述第二卷积模块的输出连接所述第二多卷积融合模块的输入,所述第一卷积模块的输出连接所述第一多卷积融合模块的输入;所述第五多卷积融合模块输出为第五特征图,所述第五特征图通过2倍上采样与所述第四多卷积融合模块的输出按元素相加输出第四特征图,所述第四特征图通过2倍上采样与所述第三多卷积融合模块的输出按元素相加后进行3×3卷积操作输出第三特征图,所述第三特征图通过2倍上采样与所述第二多卷积融合模块的输出按元素相加后进行3×3卷积操作输出第二特征图,所述第二特征图通过2倍上采样与所述第一多卷积融合模块的输出按元素相加后进行3×3卷积操作输出第一特征图;所述第一特征图、所述第二特征图、所述第三特征图、所述第四特征图和所述第五特征图均输入所述区域生成网络;所述区域生成网络连接所述ROI池化层,所述ROI池化层连接所述检测头,所述检测头用于输出检测结果;
所述第一多卷积融合模块、所述第二多卷积融合模块、所述第三多卷积融合模块、所述第四多卷积融合模块和所述第五多卷积融合模块结构相同,均包括第一卷积分支、第二卷积分支、第三卷积分支、第四卷积分支、第一SEnet注意力机制模块、第二SEnet注意力机制模块、第三SEnet注意力机制模块、第四SEnet注意力机制模块;
所述第一卷积分支包括卷积核为1*1、步长为3、像素填充为0的卷积操作,所述第二卷积分支包括卷积核为3*3、步长为2、像素填充为1的卷积操作,所述第三卷积分支包括卷积核为5*5、步长为2、像素填充为2的卷积操作,所述第四卷积分支包括卷积核为7*7、步长为2、像素填充为3的卷积操作;所述第一卷积分支输出的特征图输入所述第一SEnet注意力机制模块,所述第二卷积分支输出的特征图输入所述第二SEnet注意力机制模块,所述第三卷积分支输出的特征图输入所述第三SEnet注意力机制模块,所述第四卷积分支输出的特征图输入所述第四SEnet注意力机制模块;
所述第一SEnet注意力机制模块、所述第二SEnet注意力机制模块、所述第三SEnet注意力机制模块和所述第四SEnet注意力机制模块均基于通道维度对输入的特征图进行全局平均池化,得到尺寸为1×1×512的特征图,将尺寸为1×1×512的特征图输入第一全连接层,所述第一全连接层输出尺寸为1×1×512/r的特征图,采用ReLU激活函数对尺寸为1×1×512/r的特征图进行激活操作,通过第二全连接层将尺寸为1×1×512/r的特征图扩充为1×1×512后再经过Sigmoid函数输出包含通道注意力信息的特征图;所述r为设定值;
所述第一SEnet注意力机制模块、所述第二SEnet注意力机制模块、所述第三SEnet注意力机制模块和所述第四SEnet注意力机制模块输出的四个包含通道注意力信息的特征图进行元素级的加和操作,获得特征融合特征图,对所述特征融合特征图进行卷积核为1*1、步长为1、像素填充为0的卷积操作后输出。
2.根据权利要求1所述的基于多卷积融合网络的目标检测方法,其特征在于,所述第一卷积分支、所述第二卷积分支、所述第三卷积分支和所述第四卷积分支输出的特征的尺寸相同,尺寸均为64×64×512。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京电信易通信息技术股份有限公司,未经北京电信易通信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110707169.0/1.html,转载请声明来源钻瓜专利网。