[发明专利]适用于地铁车站人群计数的卷积网络构建方法在审
申请号: | 202110250379.1 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112818945A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张正;田青;仝淑贞;张华 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 南京科阔知识产权代理事务所(普通合伙) 32400 | 代理人: | 苏兴建 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 地铁 车站 人群 计数 卷积 网络 构建 方法 | ||
一种适用于地铁车站人群计数的卷积网络构建方法,步骤包括:首先,搭建深度学习框架作为密度生成网络:对采集得到的人群图的样本使用高斯滤波方法对人群标注,进行人群密度图生成;计算人群密度图中的人群总数;将人群图的样本和对应的人群密度图作为一个组合送入密度生成网络进行训练;利用损失函数优化。然后,设计用于判别生成密度图准确的判别网络;利用损失函数优化判别网络;训练对抗生成网络,采用对抗的训练方式来进行人群密度预测:生成模型和判别模型采用联合交替迭代的训练方式优化最大最小问题;同时,判别器的输出为生成器提供密度图位置和预测精度的反馈;两个网络同时竞争训练,直到生成器生成的样本不能被判别器正确判断。
技术领域
本发明涉及人群计数领域,具体涉及一种基于卷积神经网络的密度生成模型构建方法。
技术背景
人群计数是计算机视觉领域中的一个重要课题,主要任务是从图像中估计人群数目,需要准确地人群密度,并给出图像中的人数。近年来,人群计数在智能视频监控、公共安全、智能预警等领域都有广泛的应用。然而,由于视角、遮挡、尺度变换等因素引起目标发生形变,特别在地铁车站场景下,使人群计数成为一个具有挑战性的任务。
传统人群计数方法使用的是目标检测的方法,研究重点在于特征提取和特征分类。由此,研究者们提出了多种形式的特征和分类器。但是,由于传统目标检测方法使用设计的特征,即使运用最好的非线性分类器进行特征分类,目标检测的准确度也达不到实际需求。设计的特征存在三个主要缺点:1)设计的特征为低层特征,对目标的表达能力不足;2)设计的特征可分性较差,导致分类的错误率较高;3)设计的特征具有针对性,很难全面把握多尺度特征应用于人群计数。Davies等最早提出图像的像素特征与图像中的总人数之间呈现出一种近乎线性的关系,所以作者通过三帧差法将前景图像从整个图像中分离出来,然后统计前景区域的像素特征,之后通过先行方程求的特征数与总人数的映射关系。之后研究学者又把目光转向了卷积神经网络CNN,使用密度图作为回归目标。
发明内容
本发明要解决的技术问题是提供一种基于卷积神经网络的密度生成模型构建方法,以解决现有人群计数模型应用于识别复杂图像或多尺度目标时效果较差,不适于地铁车站人群计数的问题。
为了解决上述技术问题,本发明采用如下技术方案:
一种适用于地铁车站人群计数的卷积网络构建方法,步骤包括:
步骤1:搭建深度学习框架作为密度生成网络:
人群计数模型的配置采用U-Net算法,并用基础网络VGG16的前13层进行特征提取,VGG包括13个卷积层,三个最大池化层;
步骤2:首先,对采集得到的人群图的样本使用高斯滤波方法对人群标注,进行人群密度图生成;计算人群密度图中的人群总数;
然后,将人群图的样本和对应的人群密度图作为一个组合送入密度生成网络进行训练;
密度生成网络包括特征提取模块和密度生成模块;特征提取模块是由VGG16模型中的前13层构成,全部使用3x3卷积核,使用1x1卷积得到密度图;
步骤3:利用损失函数优化;
步骤4:所述密度生成网络的训练方法如下:
(a)采用随机梯度下降法进行训练,用预训练的VGG模型来初始化密度生成网络中的前五个卷积层;
(b)新增加的卷积层权重由零均值高斯分布随机初始化,标准差为0.01;
(c)在每次迭代过程中,将一批被标记的训练数据输入到网络中,然后更新参数;
步骤5:设计用于判别生成密度图准确的判别网络,即判别器(判别模块);
步骤6:利用损失函数优化判别网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110250379.1/2.html,转载请声明来源钻瓜专利网。