[发明专利]面向地铁车厢场景的人群计数方法在审
申请号: | 202011484695.7 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112632601A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 田青;唐绍鹏 | 申请(专利权)人: | 苏州玖合智能科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京科阔知识产权代理事务所(普通合伙) 32400 | 代理人: | 苏兴建 |
地址: | 215131 江苏省苏州市相城经济技术开发区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 地铁 车厢 场景 人群 计数 方法 | ||
1.一种面向地铁车厢场景的人群计数方法,其特征是步骤包括:
一、首先采用广角摄像机获取车厢内的图像数据,并对数据进行处理;
二、然后把数据送入人群特征识别网络进行处理,进行人群计数;
在步骤一中,将实时视频按时间截取图片,进行矫正和增强,然后把实时数据送入步骤二进行处理;
在步骤二中,对于实时数据,先判断是稀疏人群数据还是密集人群数据;人群特征识别网络使用权重A和权重B分别用于稀疏和密集人群数据计数;
权重A和权重B的选用方法为:取空无一人的车厢图片作为背景,将得到的实时数据与背景图片进行遮挡比对,当遮挡率小于某个阈值将其认定为稀疏人群数据,读取权重A来进行计数,反之,读取权重B进行计数;
所述人群特征识别网络包括:
网络前端:前端网络采用剔除了全连接层的VGG-16网络,并且采用3×3的卷积核;
上采样层:前端的VGG-16网络中,进行了三次最大池化,用以降低特征图的分辨率;
网络后端:后端网络为三层分支网络,它们分别采用空洞率为2和3的空洞卷积,空洞卷积的定义如下:
其中:x(m,n)是长宽分别为M和N的输入图像信息,经过卷积核w(i,j)得到空洞卷积的输出y(m,n);参数r表示空洞率;如果r=1,则空洞卷积是普通卷积;
所述人群特征网络的训练步骤包括:
1)生成密度图:
采用脉冲函数卷积高斯核的方式来定义密度图;
假设标注点的位置为xi,则具有N个头的标签设为H(x);如果假设在一个人头区域的周围,人群的密度是均匀的,它的最近邻给出了一个对于几何形变的合理的估计;
为了使得密度图能够更好地与不同视角且人群很密的图像对应起来,使用几何适应高斯核的密度图;对于每一个人头的位置点xi,给出了多个近邻距离的平均值di,与xi相关的像素对应于场景中地面上的一个区域,这个区域的半径与di成正比;为了估计xi周围的人群密度,则把H(x)卷积一个自适应的高斯核,这个高斯核的方差σi是可变的并且和di成比例;
2)损失函数
在训练期间,随机梯度下降的学习率固定为1e-6;
采用欧氏距离测量生成的密度图与真实值的距离;使用分块计算损失函数的方法,将高密度区域和低密度区域分别计算损失以减少误差;
3)评估标准
评估人群密度估计模型时,采用均方误差MSE和平均绝对误差MAE,MSE用来描述模型的准确度,MSE越小则准确度越高,MAE能反映出预测值的误差情况。
2.根据权利要求1所述的面向地铁车厢场景的人群计数方法,其特征是网络前端的VGG-16网络采用10层卷积层和3层池化层的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州玖合智能科技有限公司,未经苏州玖合智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011484695.7/1.html,转载请声明来源钻瓜专利网。