[发明专利]人群计数系统中基于可变形高斯核的训练数据生成方法有效
申请号: | 201911098587.3 | 申请日: | 2019-11-12 |
公开(公告)号: | CN111027389B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 刘阳;倪国栋;胡卫明;李兵;沈志忠;孔祥斌 | 申请(专利权)人: | 通号通信信息集团有限公司 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/24;G06V10/774 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 孙楠 |
地址: | 100070 北京市丰台区南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人群 计数 系统 基于 变形 高斯核 训练 数据 生成 方法 | ||
本发明涉及一种人群计数系统中基于可变形高斯核的训练数据生成方法,其步骤:从训练数据中找出一组相互重叠的高斯核;对被遮挡的高斯核进行伸缩;对被遮挡的高斯核进行旋转;对被遮挡的高斯核的中心点坐标进行调整;判断训练数据中是否还有未被选取过的高斯核,得到的带灰度数值的人群密度图作为训练数据输出。本发明有效地增加了训练数据的人群密度图与真实图像的特征相似性,使卷积神经网络更容易学习到训练数据与真实图像之间的规律,提高了人群计数系统的精确性。可以广泛在计算机视觉方向应用。
技术领域
本发明涉及一种模式识别领域,特别是关于一种在计算机视觉方向应用的人群计数系统中基于可变形高斯核的训练数据生成方法。
背景技术
近年来人群行为分析常用的基础方法是基于卷积神经网络深度学习的人群计数系统,其主要原理是:通过大量的训练,让卷积神经网络自动学习人类头部的主要特征(例如近似圆形,相对于背景来说颜色较深的头发等),最终将网络输出的卷积图与事先做好的、使用类似于人头形状的二维高斯核密度函数(以下简称高斯核)来表示每个人头所在的位置的人群密度图的对比差异。因为单个高斯核在人群密度图中的各个像素点处数值的积分之和为1,所以只需要统计输出的人群密度图中属于各个高斯核的像素点处数值的积分总和,系统就可以得到对原始画面中总人数的估计数值。系统将其对总人数的估计数值与训练数据中的实际数值,以及网络输出的卷积图与训练数据中的人群密度图之间的差异,作为网络反向误差传播的依据,最终通过迭代,修改网络中的相关参数,训练网络对于人头形状目标的识别能力。
鉴于现有的绝大部分人群计数数据库中只给出图片中的人头二维坐标作为训练数据(即训练算法去完成的目标),为了便于系统将输出的人群密度图与训练数据进行误差比对,优化卷积神经网络的训练效果,系统需要将训练数据中每个人头的二维坐标,转化为画面中类似人头的形状。因此,人群计数系统的训练数据生成方法,均采用二维高斯核密度函数,以每个人头位置坐标为中心点,在画面中生成用于训练的模拟人头形状,以达到对更好训练效果。
如上所述,人群计数系统的训练数据生成中,最关键的一个步骤就是以人头的二维坐标为中心点,生成与之对应的高斯核,为了解释高斯核的具体生成方法,首先将连续型二维高斯函数的表达式展示如下:
其中(x0,y0)为该函数的中心点位置,即人头坐标。σx与σy分别为该函数在x轴方向与y轴方向的方差。考虑到人头基本可以视作圆形,为了便于计算,上述文献中默认取σx=σy。
于是在离散域内,一个尺度为(2k+1)*(2k+1)离散的高斯核可以被表示为:
其中A为为了使高斯核截止区域内各个像素点的高斯核灰度数值积分后等于1而设置的常数,其数值并不一定等于公式1中的项的数值,需要根据实际情况加以调整,调整的目的是使得属于同一个人头head对应的那个高斯核的各个离散像素点的灰度数值相加总和为1,因此,其计算方法如下:
将公式3称为:传统人群计数系统的离散高斯核表达式。系统对训练数据中的每一个人头的坐标,重复上述过程,然后将生成的所有高斯核离散像素点的灰度数值以叠加的方式绘制在同一张画面中,就完成了训练数据的生成。
然而在现实中人群图片中大量存在一个现象,即人头因为互相遮挡而出现重叠,并且按照透视关系原理,两个相互遮挡的人头在摄像机视角方向的中心点位置越接近,其相互重叠的面积比例越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通号通信信息集团有限公司,未经通号通信信息集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911098587.3/2.html,转载请声明来源钻瓜专利网。