[发明专利]一种基于深度学习的小人头检测方法有效
申请号: | 201810800214.5 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109190458B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 陈梓蓉;金连文;孙梓凯;彭德智;蔡子瑞;谢乐乐 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/00;G06V10/44;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人头 检测 方法 | ||
1.一种基于深度学习的小人头检测方法,其特征在于,包括下述步骤:
(1)获取数据:采集不同室内场景的大量图像形成训练集和测试集;
(2)对所述训练集和测试集图像进行精准贴边的人头标注;
(3)利用R-FCN框架,构造深度卷积神经网络,然后利用训练集图像并采用批量训练的随机梯度下降法对所构造的深度神经网络进行训练,设定网络初始参数及迭代更新方式;
(4)对测试集图像进行变换处理,具体为:基于视觉透视变换对测试集图像进行聚类切割再部分放大;
(5)将变换处理后的测试集图像输入步骤(3)训练完成的深度卷积神经网络,得到每个预测框的概率分布,再通过计算损失函数,输出识别结果;
步骤(4)中,所述基于视觉透视变换对测试集图像进行切割再部分放大,具体为:
基于R-FCN框架,将图像输入宽为Wtrain,高为Htrain的图像作为测试图像;根据视觉成像近大远小的成像原理,将分布于图像上方的人头定为小人头,由xml文件计算出训练集和测试集图像中每个人头标注的长宽,用k-means聚类划分成大人头和小人头以及计算大人头和小人头的平均长宽,由计算出的平均长宽对比原来xml文件中的每个人头标注的长宽,计算大小人头在图像中的行列位置,所述行列位置是指大人头和小人头所在的区域分别在图像的前部和后部,其中图像的前部为大人头区域,分界线位置距离图片底部为Wtest,图像的前部为小人头区域,分界线距离图片顶部距离为L,然后将分类后小人头区域的图像部分放大η倍,其中η为大小人头的平均面积比例。
2.根据权利要求1所述的基于深度学习的小人头检测方法,其特征在于,在步骤(1)中,通过采集课室内监控以及网络爬虫后再通过人工筛选出复杂的图像样本来获得数据,在所形成的训练集中,人头样本包括不同角度不同人数的大小人头,部分遮挡人头,重叠人头的正、侧、后部和顶部。
3.根据权利要求1所述的基于深度学习的小人头检测方法,其特征在于,步骤(2)中,通过人工严格标注,将训练集和测试集图像放大到原来的5倍,并紧贴人头边缘进行标注。
4.根据权利要求1所述的基于深度学习的小人头检测方法,其特征在于,步骤(3)中,利用R-FCN框架,构造深度卷积神经网络,具体过程如下:
基于R-FCN框架,将图像输入宽为Wtrain,高为Htrain的图像作为训练图像;
构造深度卷积神经网络,该网络包括:输入层、13个卷积层、RPN部分、RoI部分和输出层,其中,每个卷积层紧跟一个RELU激活层,在第二、第四、第七、第十、第十三个RELU激活层后紧跟一个池化层;
所述输入层接收的图片尺寸大小为1000×600像素;所述13个卷积层的卷积核大小都为3×3,步长都为1,输出特征图分别为64,64,128,128,256,256,256,512,512,512,512,512,512;所述ReLu激活层对卷积得到的特征进行线性修正;所述池化层采用最大池化法对修正后的特征提取极大值;输出层为softmax层,输出的是图像中人头的概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810800214.5/1.html,转载请声明来源钻瓜专利网。