[发明专利]基于金字塔注意力网络的人群计数方法及系统在审
申请号: | 202010320955.0 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111523449A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 吕蕾;顾玲玉;谢锦阳;陈梓铭;张金玲 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 金字塔 注意力 网络 人群 计数 方法 系统 | ||
1.基于金字塔注意力网络的人群计数方法,其特征在于,包括:
获取待计数图像;
将获取的待计数图像,输入到训练好的基于金字塔注意力网络中,训练好的基于金字塔注意力网络对待计数图像进行特征提取,提取出第一特征和第二特征,然后将提取的第一特征和第二特征进行特征融合,得到全局特征图;将全局特征图进行密度图回归,得到人群密度图;
对人群密度图进行积分,得到最终的人群计数数值。
2.如权利要求1所述的方法,其特征在于,所述基于金字塔注意力网络,包括:
并列的第二特征提取分支和第一特征提取分支;
所述第二特征提取分支,包括:依次连接的第一输入模块、第一卷积层和空间注意力模块SA;
所述第一输入模块,包括:并列的第一输入单元和第二输入单元;第一输入单元和第二输入单元的输入端均用于输入待计数图像;第一输入单元和第二输入单元的输出端均与第一卷积层连接;
所述第一特征提取分支,包括:依次连接的第二输入模块、上下文感知金字塔特征取模块CPFE模块、通道注意力模块CA模块、第二卷积层和上采样函数层连接;
所述第二输入模块,包括:并列的第三输入单元、第四输入单元和第五输入单元,其中,第三输入单元、第四输入单元和第五输入单元的输入端均用于输入待计数图像;第三输入单元、、第四输入单元和第五输入单元的输出端均与CPFE模块连接;
第一卷积层的输出端与上采样函数层的输出端均与加法器的输入端连接,加法器的输出端与第三卷积层连接。
3.如权利要求1所述的方法,其特征在于,
所述第一输入单元,是VGG-16网络的第三个卷积模块的第一个卷积层conv1-2,用于提取输入图片第二特征;
所述第二输入单元,是VGG-16网络的第三个卷积模块的第二个卷积层conv2-2,用于提取输入图片第二特征;
所述第三输入单元,是VGG-16网络的第三个卷积模块的第三个卷积层conv3-3,用于提取输入图片第一特征;
所述第四输入单元,是VGG-16网络的第四个卷积模块的第三个卷积层conv4-3,用于提取输入图片第一特征;
所述第五输入单元,是VGG-16网络的第五个卷积模块的第三个卷积层conv5-4,用于提取输入图片第一特征;
第一卷积层,用于提取多尺度特征;
空间注意力模块SA,针对前景区域,获得显著对象和背景之间的详细边界;
上下文感知金字塔特征取模块CPFE模块,用于得多尺度高层次特征映射来获得上下文特征;
通道注意力模块CA模块,用于在上下文感知金字塔特征提取之后将CA模块添加到加权多尺度多感知域第一特征,CA将为通道提供更大的权重,这些通道对显著对象表现出高响应;
第二卷积层,用于得到第一特征图;
上采样函数层,用于将特征图采样到设定的分辨率。
4.如权利要求3所述的方法,其特征在于,所述CA模块,包括:
依次连接的池化层、第一全连接层、ReLU函数层、第二全连接层和第一Sigmoid函数层,其中池化层的输入端与CPFE模块的输出端连接;第一Sigmoid函数层的输出端与第一加权求和单元的输入端连接,第一加权求和单元的输入端还与CPFE模块的输出端连接,加权求和单元的输出端与第二卷积层连接;
其中,池化层,用于将每个应用平均合并以获得通道方向特征向量;
第一全连接层,用于完全捕获通道依赖性;
ReLU函数层,用于编码通道方向特征向量;
第二全连接层,用于完全捕获通道依赖性;
第一Sigmoid函数层,用于将归一化处理度量采用映射到[0,1]的编码的通道方向特征向量;
第一加权求和单元,用于获得CA模块的最终输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010320955.0/1.html,转载请声明来源钻瓜专利网。