[发明专利]一种不均衡场景中人群分布与计数的检测方法有效
申请号: | 201911084086.X | 申请日: | 2019-11-07 |
公开(公告)号: | CN110991252B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 姜晓恒;徐明亮;张力;吕培;朱睿杰;李亚飞;高志敏;郭毅博;周兵 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/80;G06V10/82 |
代理公司: | 广东君龙律师事务所 44470 | 代理人: | 金永刚 |
地址: | 450001 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 均衡 场景 人群 分布 计数 检测 方法 | ||
1.一种不均衡场景中人群分布与计数的检测方法,其特征在于,包括以下步骤:
构建网络,构建一个多级卷积神经网络,该网络包括卷积层、池化层和转置卷积层且具有多个分支网络,每一个分支网络的输入来自不同分辨率的卷积层的输出组合,每一个分支网络再融合为一个整体输出;
预测密度,使用训练图集分别输入到所述多级卷积神经网络,得到预测密度图;
计算优化,引入所述训练图集的场景中的人群数量信息,与所述预测密度图进行比较来计算损失,通过优化调整所述多级卷积神经网络的参数,使得计算损失的结果最小;
数据验证,进一步通过公开的数据图集对经过计算损失优化的所述多级卷积神经网络进行验证,最终获得最佳预测效果;
所述多级卷积神经网络包括骨干网络和三个分支网络,在骨干网络中从输入端开始依次是第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第五卷积层和第一融合卷积层;第一分支网络包括从所述第三卷积层中的三个卷积子层输出后相叠加,再经过第二融合卷积层输出;第二分支网络包括从所述第五卷积层中的三个卷积子层输出后相叠加,再经过第一融合卷积层输出;第三分支网络包括从所述第四卷积层中的三个卷积子层输出后相叠加,再经过第三融合卷积层输出,所述第一融合卷积层、第二融合卷积层和第三融合卷积层共同输出到汇聚卷积层,再由汇聚卷积层输出终检测结果。
2.根据权利要求1所述的不均衡场景中人群分布与计数的检测方法,其特征在于,第一卷积层对应的特征图的宽度和高度与输入的图像的宽度和高度相同,包括第一输入卷积子层和第一输出卷积子层,第一输入卷积子层的输入通道数为3,输出通道数为64,第一输出卷积子层的输入通道数为64,输出通道数为64,第一池化层的输入通道数为64,输出通道数为64;第二卷积层对应的特征图的宽度和高度分别对应是输入的图像的宽度的二分之一和高度的二分之一,包括第二输入卷积子层和第二输出卷积子层,第二输入卷积子层的输入通道数为64,输出通道数为128;第二输出卷积子层的输入通道数为128,输出通道数为128,第二池化层的输入通道数为128,输出通道数为128。
3.根据权利要求2所述的不均衡场景中人群分布与计数的检测方法,其特征在于,第三卷积层对应的特征图的宽度和高度分别对应是输入的图像的宽度的四分之一和高度的四分之一,包括第三输入卷积子层、第三中间卷积子层和第三输出卷积子层;第三输入卷积子层的输入通道数为128,输出通道数为256;第三中间卷积子层的输入通道数为256,输出通道数为256;第三输出卷积子层的输入通道数为256,输出通道数为256;第三池化层的输入通道数为256,输出通道数为256;第四卷积层对应的特征图的宽度和高度分别对应是输入的图像的宽度的八分之一和高度的八分之一,包括第四输入卷积子层、第四中间卷积子层和第四输出卷积子层;第四输入卷积子层的输入通道数为256,输出通道数为512;第四中间卷积子层的输入通道数为512,输出通道数为512;第四输出卷积子层的输入通道数为512,输出通道数为512;第四池化层的输入通道数为512,输出通道数为512。
4.根据权利要求3所述的不均衡场景中人群分布与计数的检测方法,其特征在于,第五卷积层对应的特征图的宽度和高度分别对应是输入的图像的宽度的十六分之一和高度的十六分之一,包括第五输入卷积子层、第五中间卷积子层和第五输出卷积子层;第五输入卷积子层的输入通道数为512,输出通道数为512;第五中间卷积子层的输入通道数为512,输出通道数为512;第五输出卷积子层的输入通道数为512,输出通道数为512。
5.根据权利要求4所述的不均衡场景中人群分布与计数的检测方法,其特征在于,所述第一分支网络包括由第三卷积层的第三输入卷积子层、第三中间卷积子层和第三输出卷积子层进行相加输出到第二融合卷积层,第二融合卷积层包括依次串联的第二融合输入卷积层和第二融合输出卷积层,对应的特征图均为输入的图像的宽度的八分之一和高度的八分之一;第二融合输入卷积层的输入通道数为256,输出通道数为256,第二融合输出卷积层的输入通道数为256,输出通道数为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911084086.X/1.html,转载请声明来源钻瓜专利网。