[发明专利]一种基于深度学习的人群统计方法有效
申请号: | 201710318219.X | 申请日: | 2017-05-08 |
公开(公告)号: | CN108804992B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 雷航;杨铮 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06N3/04 |
代理公司: | 成都泰合道知识产权代理有限公司 51231 | 代理人: | 向晟 |
地址: | 610051 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人群 统计 方法 | ||
1.一种基于深度学习的人群统计方法,其特征在于,包括以下步骤:
步骤1,采用灰度世界算法对预处理图像进行白平衡预处理;
步骤2,采用K近邻算法的背景分割方法提取预处理后的图像;
步骤3,采用保证视角和透视不变性的方法遍历前景区域每个像素,以像素坐标(x,y)作为子区域中心,将像素坐标(x,y)输入训练好的线性模型得到人体区域的尺寸;人体区域尺寸的计算公式如下:
w=θ0+θ1·x+θ2·y
h=ω0+ω1·x+ω2·y
其中w,h分别表示在坐标(x,y)的人体区域的宽和高;θ,ω分别代表求人体区域宽和高的线性模型的权重,θi和ωi是可学习的权重,通过从检测场景中手动截取人体区域并使用线性回归算法训练得到;
步骤4,采用卷积神经网络作为人体检测模型;其中,将从原图截取经计算后的所有人体区域子图像输入卷积神经网络判断是否为人体;
步骤5,统计最终人体数量。
2.根据权利要求1所述的一种基于深度学习的人群统计方法,其特征在于:步骤1所述灰度世界算法对图像进行白平衡预处理,进一步包括以下步骤:
1)对预处理图像三个通道取平均值;
2)求取各个通道的增益并将增益值叠加到原图;
3)对结果做规划处理;
公式如下:
Iout=(Rnew,Gnew,Bnew)
其中MR、MG、MB分别表示输入图像R、G、B三个通道的均值,α则表示三个通道的全局均值,K表示各个通道的增益值,Rnew、Gnew、Bnew表示叠加增益后三通道,Iout表示经过增益叠加后的图像;对于上式处理,可能会存在溢出255,不会出现小于0的现象,实验表明若直接将255像素设置为255可能会造成图像整体偏白,因此采用计算所有Rnew、Gnew、Bnew的最大值,然后利用该最大值将计算后数据重新线性映射到[0,255]内。
3.根据权利要求1或2所述的一种基于深度学习的人群统计方法,其特征在于:步骤1中所述图像经过白平衡预处理会自动均衡像素的灰度值。
4.根据权利要求1所述的一种基于深度学习的人群统计方法,其特征在于:其中步骤2所述提取图像采用K近邻算法的背景分割方法,遍历输入图像的每个像素,寻找该像素某个邻域内与之距离最近的K个像素点,对这些点的所属类别进行多数表决,确定当前像素的类别;分类决策规则如下:
其中,I(·)为指示函数,即当yi=cj时函数去1,否则0。
5.根据权利要求1或4所述的一种基于深度学习的人群统计方法,其特征在于:对步骤2中所述提取预处理后的图像进行膨胀腐蚀运算。
6.根据权利要求1所述的一种基于深度学习的人群统计方法,其特征在于:将所有被判定存在人体的区域按照网络输出值即判定为人体的置信度排序,将置信度最高的区域作为标准,去掉超过某个设定阈值的所有区域;公式如下:
其中,Sover表示参与判定的两个区域的重叠部分的面积;S表示参与判定的两个区域面积的总和;将f(o)为0的区域去除,剩下的区域为最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710318219.X/1.html,转载请声明来源钻瓜专利网。