[发明专利]一种面向行人检测的轻量级卷积神经网络模型在审
申请号: | 202210499061.1 | 申请日: | 2022-05-09 |
公开(公告)号: | CN114882530A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 李旭;殷竟成;朱建潇 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 行人 检测 轻量级 卷积 神经网络 模型 | ||
1.一种面向行人检测的轻量级卷积神经网络模型,其特征在于,该轻量级卷积神经网络模型由多个基本组成模块堆叠而成,每个所述基本组成模块采用多分支的并行结构获取不同尺度感受野下的特征,每个分支包含不同扩张率的空洞卷积和分组卷积;在基本组成模块之后,连接空间注意力机制模块。
2.根据权利要求1所述的一种面向行人检测的轻量级卷积神经网络模型,其特征在于,所述基本组成模块包含三个分支的并行结构,分别采用扩张率为3、5、7的空洞卷积,以及分组数分别为4、8、16的分组卷积,卷积核大小都为3×3,在卷积操作后添加批归一化层和激活函数;
所述空洞卷积具体是指向普通卷积层引入新参数“扩张率”,该参数定义了卷积核处理数据时每个值相互之间的间距,根据扩张率往卷积核中间填充0,随后再做卷积操作;
所述分组卷积是指将整个卷积过程拆成若干组规模更小的子运算来并行进行,具体包含如下两个子步骤:
步骤一:保持输入数据的高度和宽度不变,根据通道数将其分成若干组;
步骤二:分别对每个组执行卷积运算,随后将所有组的输出矩阵进行拼接得到最终结果。
3.根据权利要求2所述的一种面向行人检测的轻量级卷积神经网络模型,其特征在于,将所述基本组成模块包含的三个分支的结果进行相加操作。
4.根据权利要求1所述的一种面向行人检测的轻量级卷积神经网络模型,其特征在于,所述空间注意力机制模块包含以下子模块:
子模块一:全局最大池化层和全局平均池化层,用于将输入的特征图(H×W×C)分别进行全局最大池化和全局平均池化操作从而降低通道数,得到两个H×W×1的特征图,然后将这2个特征图进行拼接操作得到通道数为2的特征图,其中,H表示特征图的高度,W表示特征图的宽度,C表示特征图的通道数;
子模块二:一维卷积层和激活函数层,用于将子模块一输出的特征图输入一个3×3的一维卷积进行学习,从而将通道数降为1,即H×W×1,再经过激活函数生成空间注意力特征图;
子模块三:通道相乘层,用于将子模块二输出的空间注意力特征图和最开始的输入特征图进行通道相乘操作。
5.根据权利要求1所述的一种面向行人检测的轻量级卷积神经网络模型,其特征在于,网络中的激活函数均使用Hard Swish函数,具体公式如下:
ReLU6(x)=min(6,max(0,x))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210499061.1/1.html,转载请声明来源钻瓜专利网。