[发明专利]基于金字塔注意力网络的人群计数方法及系统在审
申请号: | 202010320955.0 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111523449A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 吕蕾;顾玲玉;谢锦阳;陈梓铭;张金玲 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 金字塔 注意力 网络 人群 计数 方法 系统 | ||
本发明公开了基于金字塔注意力网络的人群计数方法及系统,包括:获取待计数图像;将获取的待计数图像,输入到训练好的基于金字塔注意力网络中,训练好的基于金字塔注意力网络对待计数图像进行特征提取,提取出第一特征和第二特征,然后将提取的第一特征和第二特征进行特征融合,得到全局特征图;将全局特征图进行密度图回归,得到人群密度图;对人群密度图进行积分,得到最终的人群计数数值。
技术领域
本公开涉及计算机视觉技术领域,特别是涉及基于金字塔注意力网络的人群计数方法及系统。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
随着踩踏事件的频繁发生,为了人群控制和公众安全,准确地估计来自图像的人群的人数已经成为计算机视觉技术越来越重要的应用。计算机视觉技术中的人群计数任务是自动计算图像中的人数。为了在诸如公众集会和体育赛事等许多场景中帮助控制人群和公共安全,准确的人群计数显得越来越重要。
在大多数需要进行人群计数和密度估计的场景下,人群的密集度均较高,也就造成了严重的遮挡、目标尺度不一致的问题。早期的方法一般使用基于检测和回归的方法统计场景中人的总数。
由于密集人群遮挡严重、目标尺寸相差较大,基于检测的方法效果较差;而直接回归场景中人的数目从获取一个目标函数的角度来讲使问题的输入域和输出域相差很大,也就导致了目标函数更难以拟合,也无法达到较好的效果。
针对以上两种传统方法的不足,基于深度学习卷积神经网络的方法被用于密集人群图像的估计中。目前主流的估计方法采用了密度图的思想,即设计一个神经网络,网络的输入为原始图像,而输出为人群的密度图。
在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:
近年来,基于多尺度提取特征的方法成为了人群计数的主流,此类方法既可以简化任务的目标函数,也可以在统计人群总数的基础上得到信息更加充足的人群密度分布,为后续的其他应用提供更大的帮助。
目前效果较好的方法为基于多路卷积的方法,使用多路具有不同大小卷积核的卷积神经网络提取原始图像中的多尺度信息,之后将得到的多组特征图进行融合,得到最终的密度图,在一定程度上解决了人群计数中最为棘手的多尺度问题。
但此类方法由于使用多路不同的卷积神经网络,多路分支的参数及其提取的特征均存在大量冗余,同时由于参数量巨大,计算复杂度高、计算速度慢,为了控制参数导致网络较浅,每一路分支网络都无法充分地提取相应的信息,在一定程度上限制了其效果。
发明人发现,现有技术中的针对图像处理的人群计数方法,存在效率低和准确率低的技术缺陷。
发明内容
为了解决现有技术的不足,本公开提供了基于金字塔注意力网络的人群计数方法及系统;
第一方面,本公开提供了基于金字塔注意力网络的人群计数方法;
基于金字塔注意力网络的人群计数方法,包括:
获取待计数图像;
将获取的待计数图像,输入到训练好的基于金字塔注意力网络中,训练好的基于金字塔注意力网络对待计数图像进行特征提取,提取出第一特征和第二特征,然后将提取的第一特征和第二特征进行特征融合,得到全局特征图;将全局特征图进行密度图回归,得到人群密度图;
对人群密度图进行积分,得到最终的人群计数数值。
第二方面,本公开提供了基于金字塔注意力网络的人群计数系统;
基于金字塔注意力网络的人群计数系统,包括:
获取模块,其被配置为:获取待计数图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010320955.0/2.html,转载请声明来源钻瓜专利网。