[发明专利]多级注意力尺度感知人群计数方法在审
申请号: | 202110605990.1 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113283356A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 祝鲁宁;黄良军;沈世晖;张亚妮 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多级 注意力 尺度 感知 人群 计数 方法 | ||
本发明提供了一种多级注意力尺度感知人群计数方法,属于深度学习在计算机视觉中的应用。该方法具体步骤如下:S1:获取数据集;S2:构建多级注意力尺度感知神经网络;S3:调试并训练多级注意力尺度感知神经网络并测试;S4:获取摄像头图像,输入训练好的神经网络进行测试,得到该图片的预测密度图和预测人数。通过上述方式,本发明能够适用于大规模场景时的人群数量检测,有效的提高检测结果准确性。
技术领域
本发明涉及一种多级注意力尺度感知人群计数方法。
背景技术
随着国家城市化步伐的加快和城市经济的迅猛发展,人群集会场景增多,旅游人数增多,但同时伴随而来的还有安全隐患。因此通过设计一种人群计数方法,预测人群数量,对高度拥挤的场景进行预警,可以帮助相关人员进行突发事件事前预警和事后决策,人们的生命和财产安全就可得到保障,避免危险事件的发生。
目前已有的人群计数主要分为两种:1)基于传统方法的方法,例如支持向量机、决策树等;2)基于深度学习的方法,如MCNN、CSRNet等网神经络方法。以上基于深度学习的人群计数方法均存在一定的局限性。方法1)使用传统方法,复杂度高,精度差;方法2)使用现有神经网络,精度较低等问题。
发明内容
本发明的目的在于提供一种多级注意力尺度感知人群计数方法。
为解决上述问题,本发明提供一种多级注意力尺度感知人群计数方法,包括:
S1:获取数据集并进行预处理,得到训练集的密度图和测试集的密度图;
S2:构建多级注意力尺度感知神经网络的主干;
S3:基于所述训练集、测试集和多级注意力尺度感知神经网络的主干,调试并训练多级注意力尺度感知神经网络并测试网络有效性,以得到训练好的神经网络;
S4:获取摄像头图像,输入训练好的神经网络进行测试,得到该图片的预测密度图和预测人数。
进一步的,所述步骤S1包括:
S11:下载公开数据集,将所述公开数据集分成训练集和测试集;
S12:对训练集和测试集进行数据增强,将图像左右翻转,增加一倍数据量,以分别得到训练集的图像数据和测试集的训练集和测试集;
S13:将所述训练集的图像数据和测试集的训练集和测试集的宽高像素补充为16的倍数,并按比例调整定位图的位置,以得训练集的标签的定位图和测试集的标签的定位图;
S14:利用高斯核大小为15的高斯核函数,将所述标签的训练集的标签的定位图处理为训练集的密度图,并将所述标签的测试集的标签的定位图处理为测试集的密度图。
进一步的,所述步骤S2包括:
S21:设计提取特征的编码器的结构:以VGG16的前十层作为特征提取层, kernel=3,采用Conv2d卷积,每个卷积层后都加上Relu激活函数,层数为64, 64,128,128,maxpooling(kernel=2),256,256,256,maxpooling(kernel=2), 512,512,512,用此编码器的结构提取到深度特征feature,加载VGG16预训练参数;
S22:设计所述解码器的回归人群密度图和人数。
进一步的,所述步骤S22包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110605990.1/2.html,转载请声明来源钻瓜专利网。