[发明专利]人脸检测方法和装置在审
申请号: | 201710858134.0 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107644209A | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 杜康 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 | ||
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及人脸检测方法和装置。
背景技术
随着互联网技术的发展,人脸检测技术应用到了越来越多的领域。例如,可以通过人脸检测来进行身份验证等。现有的人脸检测方法通常是直接对所拍摄的图像进行人脸区域的检测。然而,人在运动状态下(例如跑动状态、跳跃状态下)被拍摄的图像通常较模糊,无法呈现清晰的人脸轮廓和五官,因而现有的方式存在着在模糊图像的检测结果的准确性较低的问题。
发明内容
本申请实施例的目的在于提出一种改进的人脸检测方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种人脸检测方法,该方法包括:获取待检测图像;将待检测图像输入至预先训练的第一卷积神经网络,得到人脸特征信息,其中,第一卷积神经网络用于提取人脸特征;将待检测图像输入至预先训练的第二卷积神经网络,得到语义特征信息,其中,第二卷积神经网络用于提取图像的语义特征;对人脸特征信息和语义特征信息进行解析,生成人脸检测结果。
在一些实施例中,人脸特征信息包括第一人脸特征图和多个第二人脸特征图,其中,第一人脸特征图中的每一个点用于表征待检测图像中与该点相对应的区域存在人脸的置信度,各个第二人脸特征图中的每一个点用于表征待检测图像中与该点相对应的区域的位置信息,第一人脸特征图和各个第二人脸特征图分别以矩阵进行表示。
在一些实施例中,语义特征信息包括待检测图像中的每一个点属于多个预设类别中的各个预设类别的概率,其中,多个预设类别包括背景类和以下至少一项:头发类、眼睛类、鼻子类、嘴类、肤色类,语义特征信息以矩阵进行表示。
在一些实施例中,对人脸特征信息和语义特征信息进行解析,生成人脸检测结果,包括:将人脸特征信息和语义特征信息进行结合,生成结合特征信息;将结合特征信息输入至预先训练的第三卷积神经网络,得到人脸检测结果,其中,第三卷积神经网络用于表征人脸特征信息、语义特征信息与人脸检测结果的对应关系。
在一些实施例中,将人脸特征信息和语义特征信息进行结合,生成结合特征信息,包括:按照以下任一方式将人脸特征信息和语义特征信息进行结合,生成结合特征信息:将人脸特征信息和语义特征信息按对应元素相乘,将人脸特征信息和语义特征信息按对应元素取最大,将人脸特征信息和语义特征信息按对应元素进行阈值截断。
在一些实施例中,该方法还包括训练第三卷积神经网络的步骤,包括:提取预设的训练样本,其中,训练样本包括多个图像的人脸特征信息和语义特征信息;将多个图像中的每一个图像的人脸特征信息和语义特征信息进行结合,得到该图像的结合特征信息;利用机器学习方法,将多个图像中的各个图像的结合特征信息作为输入,将人脸检测结果作为输出,训练得到第三卷积神经网络。
第二方面,本申请实施例提供了一种人脸检测装置,该装置包括:获取单元,配置用于获取待检测图像;第一输入单元,配置用于将待检测图像输入至预先训练的第一卷积神经网络,得到人脸特征信息,其中,第一卷积神经网络用于提取人脸特征;第二输入单元,配置用于将待检测图像输入至预先训练的第二卷积神经网络,得到语义特征信息,其中,第二卷积神经网络用于提取图像的语义特征;生成单元,配置用于对人脸特征信息和语义特征信息进行解析,生成人脸检测结果。
在一些实施例中,人脸特征信息包括第一人脸特征图和多个第二人脸特征图,其中,第一人脸特征图中的每一个点用于表征待检测图像中与该点相对应的区域存在人脸的置信度,各个第二人脸特征图中的每一个点用于表征待检测图像中与该点相对应的区域的位置信息,第一人脸特征图和各个第二人脸特征图分别以矩阵进行表示。
在一些实施例中,语义特征信息包括待检测图像中的每一个点属于多个预设类别中的各个预设类别的概率,其中,多个预设类别包括背景类和以下至少一项:头发类、眼睛类、鼻子类、嘴类、肤色类,语义特征信息以矩阵进行表示。
在一些实施例中,生成单元包括:结合模块,配置用于将人脸特征信息和语义特征信息进行结合,生成结合特征信息;输入模块,配置用于将结合特征信息输入至预先训练的第三卷积神经网络,得到人脸检测结果,其中,第三卷积神经网络用于表征人脸特征信息、语义特征信息与人脸检测结果的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710858134.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摩擦副密封结构
- 下一篇:一种组合桥面用梳齿形伸缩装置