[发明专利]基于生成对抗网络的人群计数方法有效
申请号: | 201810476256.8 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108764085B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 徐奕;倪冰冰;沈赞 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/82;G06K9/62;G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 人群 计数 方法 | ||
本发明提供了一种基于生成对抗网络的人群计数方法,包括:构建生成对抗网络,所述生成对抗网络包括:生成器和判别器;所述生成器用于根据输入的人群图像生成对应的人群密度图像;所述判别器用于在所述生成对抗网络的训练阶段,判别所述生成器生成的人群密度图像的真伪;对所述生成对抗网络进行跨尺度一致性训练,得到训练后的生成对抗网络;将待统计的人群图像作为所述训练后的生成对抗网络的输入,得到目标人群密度图像,并统计所述目标人群密度图像中的人数。本发明中的方法对于监控场景的人群数量统计很有效,对复杂多变的背景以及高密度的人群都具有很好的鲁棒性。
技术领域
本发明涉及计算机视觉技术领域,具体地,涉及基于生成对抗网络的人群计数方法。
背景技术
随着科技、金融和文化的发展,人类的活动内容及范围也在不断的扩大,呈现出人群数量多,密集程度大的趋势。而人群作为人类活动的主体,以一种有别于个体的形式存在,人与人之间的交互产生了更多的未知性,因此,出现了大量跟人群活动相关的安全事故,传统的事故防范方式已经无法满足人类的需求。随着技术的发展和硬件水平的提升,视频监控在安全领域渐渐进入了人类的视线。人们希望能够利用视频监控,提高对人群密集场景的事故防范能力,而人群计数作为人群分析当中最重要的一项基本指标,它的精确性将直接影响对潜在事故的检测能力。依靠人力去计算如此多的监控画面中的人数显然是不可能的,因此,如何利用计算机通过高效的算法,实时地对每一个监控画面中的人群进行计数,从而达到对事故的警报甚至预警的作用,成为了一个亟待解决的问题。
经过对现有的计数的文献检索发现,目前的人群计数算法主要原理有三类:
第一类基于行人检测,这种方法比较直接,在人群较稀疏的场景中,通过检测视频中的每一个行人,进而得到人群计数的结果,一般使用基于外观和运动特征的boosting,贝叶斯模型为基础的分割,或集成的自顶向下和自底向上的处理,这种方法在人群拥挤的情况下效果不甚理想,需要运用到基于部件模型(如DPM)的检测器来克服人群拥挤遮挡的问题。
第二类基于视觉特征轨迹聚类,对于视频监控,一般用KLT跟踪器和聚类的方法,通过轨迹聚类得到的数目来估计人数。该方法不适用于单张图像的情况,而同样在人群拥挤的情况下效果不理想,其他运动物体也会带来误差。
第三类是基于特征的回归,建立图像特征和图像人数的回归模型,通过提取图像特征从而回归场景中的人数。其中包括人工设计特征和利用深度神经网络的方法学习特征,而由深度神经网络的方法学得的特征相比于人工设计特征具有更好的表征性。
近阶段提出的人群计数的方法大多是第三类中基于深度学习的算法,Zhang Cong等人在2015年《IEEE Conference on Computer Vision and Pattern Recognition》(IEEE机器视觉和模式识别国际会议)发表的“Cross-scene crowd counting via deepconvolutional neural networks”一文中提出了一个简单的卷积神经网络结构,他利用先验的图像景深信息对不同位置的图像块进行缩放到同一尺度以作为网络的输入,从而避免了由远近带来的人像尺度不同的问题,并且最后能回归得到人数以及对应人群位置的人群密度图像。该算法的缺点在于将其应用于某一个场景时,必须先获取该场景的景深信息。Zhang Yingying等人在2016年《IEEE Conference on Computer Vision and PatternRecognition》发表的“Single-image crowd counting via multi-column convolutionalneural network”一文提出利用三个卷积子各不相同的卷积通道来获取图像在不同尺度上的特征然后融合到一起,从而减少尺度变化带来的计数误差。该算法网络较浅,使得背景和前景(人群)不易分清,且网络中的池化层使得最终得到的人群密度图像尺寸相比原图小并存在模糊。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于生成对抗网络的人群计数方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810476256.8/2.html,转载请声明来源钻瓜专利网。