[发明专利]一种基于多尺度特征金字塔网络及密集人群计数方法在审
申请号: | 202110293926.4 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113011329A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 雷涛;张栋;孙瑞;王兴武;杜晓刚 | 申请(专利权)人: | 陕西科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安众和至成知识产权代理事务所(普通合伙) 61249 | 代理人: | 张震国 |
地址: | 710021*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 金字塔 网络 密集 人群 计数 方法 | ||
1.一种基于多尺度特征金字塔网络,其特征在于,包括特征提取模块、特征金字塔融合模块、特征注意力感知模块和输出模块,所述特征提取模块用于对输入的人群图像进行特征提取并输出特征图;所述特征金字塔融合模块用于对所述特征提取模块输出的特征图进行多尺度信息提取并输出多尺度信息特征图,所述特征金字塔融合模块采用变化膨胀率的卷积核,对输入的特征图进行分组并行卷积,捕获多尺度信息;所述特征注意力感知模块用于对所述特征金字塔融合模块输出的多尺度信息特征图通过动态聚焦图像中关键高密度分布位置选择不同尺度信息,学习空间与通道之间的视觉相关性,输出空间通道相关特征图;所述输出模块用于对所述特征注意力感知模块输出的空间通道相关特征图采用1×1卷积进行降维,再使用双线性插值方法输出预测密度图。
2.根据权利要求1所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征提取模块为VGG16的前十层。
3.根据权利要求1所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征金字塔融合模块包括四个卷积层,在每层中将特征图按照比例进行分块,再对每一块进行分组膨胀卷积。
4.根据权利要求3所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征金字塔融合模块的多尺度信息提取包括:
1)输入特征图的通道数量为M,在第一层将特征图分为4块,每块特征图通道的数量为C1,C2,C3,C4,其中C1+C2+C3+C4=M,所有卷积核为带有不同膨胀率r(r=1,2,3,4)的3×3卷积核,分组数G以2n的形式增长;
2)将第一层输出的特征图作为第二层的输入,第二层将特征图分为3块,卷积核尺寸为3×3,膨胀率r和分组数G从1开始逐渐增长;
3)将第二层输出的特征图作为第三层的输入,第三层将特征图分为2块,执行分组数分别为1和2,膨胀率分别为1和2的卷积运算;
4)将第三层输出的特征图作为第四层的输入,第四层采用分组数G为1的标准卷积。
5.根据权利要求4所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征金字塔融合模块中输入的特征图x经过所述特征金字塔模块输出的多尺度信息特征图yi(x)定义如下:
其中,PGconv(x,Ni,Gi,ri)为金字塔式分组膨胀卷积,L为层数,Ni为分块数,ri为膨胀率,Gi为每次卷积运算的分组数。
6.根据权利要求4所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征金字塔融合模块中金字塔分组卷积计算量被定义为:
其中,N为按比例分的块数,Gi,Ki,分别为第i次金字塔分组卷积的分组数、卷积核大小、输入通道数和输出通道数,1≤i≤N。
7.根据权利要求1所述的一种基于多尺度特征金字塔网络,其特征在于,所述特征注意力感知模块包括并行的位置注意力机制和通道注意力机制,利用位置注意力机制得到位置注意力特征图,利用通道注意力机制得到通道注意力特征图,然后将位置注意力特征图和通道注意力特征图进行融合进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西科技大学,未经陕西科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293926.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风电场仿真系统及其仿真方法
- 下一篇:一种中药香