[发明专利]基于卷积神经网的深度图像头部检测与定位方法及系统在审
申请号: | 202010820333.4 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111931670A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 马祥天;肖仕华;蔡木目心;王旭鹏;桑楠;焦运磊 | 申请(专利权)人: | 成都数城科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06T7/73 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经 深度 图像 头部 检测 定位 方法 系统 | ||
本发明公开了基于卷积神经网的深度图像头部检测与定位方法及系统,属于图像处理技术领域,方法包括对图像进行分类处理,再进行聚类分析,能够得到头部中点信息,进而实现多目标的头部检测与定位。本发明对图像进行分类处理,可以获得包含头部信息的所有待处理目标图像;再将待处理目标图像进行聚类分析,能够消除背景及噪声的干扰,得到包含至少一个头部目标对应样本点在真实头部中心区域形成的密集点簇,以获取头部中点信息,进而在复杂环境下实现了多目标的头部的检测与精确定位。
技术领域
本发明涉及图像处理技术领域,尤其涉及基于卷积神经网的深度图像头部 检测与定位方法及系统。
背景技术
头部检测,作为计算机视觉的重要组成部分,广泛应用于生活中的各个领 域,更是许多基于人脸研究领域的基础,如头部姿态分析、人脸的验证与识别、 注意力分析等。在过去的一段时间里,人们对头部的检测与定位进行了大量的 研究,无论是在实际应用或学术研究中,都提供了许多精确的和有竞争力的解 决方案。但绝大多数的研究均致力于普通RGB图像的分析。然而,受制于成像 原理,RGB图像的成像质量非常依赖于光照条件,这导致在某些重要的应用场 合,无法通过普通RGB相机获得有效的图像信息,而IntelRealSense等设备的 广泛应用获取有效的深度图像成为一种现实,而深度相机基于红外的成像原理,使深度图像对光照条件以及图像尺寸具有不敏感性,能很好地弥补普通RGB图 像的相关缺陷。
目前,Chen等人在《基于深度图像的头部检测深度信息挖掘》中,提出了 一种新的头部描述符合对像素进行分类,即通过一个线性的判别分析(LDA)分类 器,将输入图像中的每个像素分类为属于或不属于头部,再通过深度数据分析, 消除头部中心的误报,并作为最终的头部检测聚类像素。A.T.Nghiem等人在《使 用kinect摄像头进行头部检测及其在坠落检测中的应用》构建的人体跌倒检测 框架中,首先利用三维数据进行头部检测,该方法通过背景减除法检测运动物 体,并在轮廓线段上搜索所有可能的头部位置。G.Fanelli等人在《基于随机回 归森林的实时头位估计》中,考虑到随机回归森林处理大型训练数据的能力, 通过该方法对头部进行定位。G.Borghi等人在《基于深度图像的头部姿态估计 方法》中,利用深度学习强大的感知能力,用深度头像和头部中点真实值来训 练CNN模型,进而预测头部位置。然而以上两种情况,作者只考虑了头部定位 问题,且假设预测对象上有且只有一个测试目标。
最近DiegoBallotta等人在《基于深度图像的野外头部检测》中,首次通 过卷积神经网络处理基于深度图像的头部检测问题,他们将每一帧深度图像划 分为若干个图像块,利用分类器将每个图像块划分为头部与非头部,并通过滑 动窗口检测和定位头部。然而,受噪声以及杂乱背景的影响,图像块误检测现 象较多,且网络性能过度依赖于计算时间。之后,DiegoBallotta等人在《基于 深度图像的全卷积网络头部检测》中,又通过全卷积网络,对于每个输入帧, 创建一个以头部位置为中心的二元高斯分布,提高了检测准确率和检测效率, 然而该方法仅局限于单目标任务且定位精度较低。
发明内容
本发明的目的在于克服现有技术头部检测与定位中局限于单目标任务且精 度较低的问题,提供基于卷积神经网的深度图像头部检测与定位方法及系统。
本实用新型的目的是通过以下技术方案来实现的:基于卷积神经网的深度 图像头部检测与定位方法,所述方法具体包括:
对图像进行分类处理,获得包含头部信息的所有待处理目标图像;将待处 理目标图像进行聚类分析,得到头部中点信息,进而实现多目标的头部检测与 定位。
作为一选项,所述对图像进行分类处理包括特征提取步骤:
将原始图像转换为多通道图像,并采用不同卷积核对该多通道图像进行卷 积操作,获取原始图像在不同尺度上的特征映射,再通过多个残差块进行特征 提取,以提取原始图像的低层特征和高层特征。
作为一选项,所述特征提取步骤后还包括目标分类步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数城科技有限公司,未经成都数城科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010820333.4/2.html,转载请声明来源钻瓜专利网。