[发明专利]一种基于组合深度网络的人脸属性识别方法和装置在审
申请号: | 201711498120.9 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108596011A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 熊荔;张峰;张德 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京中知法苑知识产权代理事务所(普通合伙) 11226 | 代理人: | 常玉明;张兰海 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人脸 区域提取 神经网络 输出 人脸区域 属性识别 穿戴 属性识别装置 方法和装置 关键部位 局部区域 年龄估计 人脸表情 人脸图像 随机森林 性别识别 训练样本 重要部位 概率 算法 相加 嘴唇 表情 预测 网络 | ||
1.一种基于组合深度神经网络的人脸属性识别方法,包括以下步骤:
S1:对输入的人脸图像进行区域提取;
S2:依据所述区域提取的结果,对人脸重要部位进行定位并提取相关区域,获取人脸区域特征以及人脸关键部位特征;
S3:将所述区域提取的结果作为训练样本,标记每个人脸的真实年龄和性别,基于深度神经网络进行训练,输出年龄估计值和性别识别结果;
S4:基于上述S2的输出的人脸区域特征以及眼睛与嘴唇局部区域特征,利用随机森林算法,分别输出表情与穿戴的预测概率,对于不同属性,将对应属性的概率相加,输出人脸表情与穿戴属性结果。
2.如权利要求1所述的方法,所述S1包括:
S11:基于三个级联深度卷积神经网络,对人脸进行识别和提取,得到人脸区域的回归矩形坐标;
S12:以人脸回归矩形的中心坐标为中心,提取人脸区域,将人脸区域放大原回归矩形区域的15%;
S13:对人脸进行切割,并统一至预定尺寸。
3.如权利要求2所述的方法,所述级联深度卷积神经网络规模依次为12层、24层和48层。
4.如权利要求1所述的方法,所述S2包括:
S21:基于一个6层的深度卷积神经网络,对步骤S1所获得人脸区域提取结果中的五官进行定位,分别得到9个关键点坐标,即左右眼的眼角和中心坐标、鼻尖坐标以及两个嘴角坐标;
S22:根据9个关键点坐标提取眼睛、鼻子与嘴唇区域;
S23:提取每一卷积层的人脸区域特征以及人脸关键部位特征。
5.如权利要求4所述的方法,在所述S22中,人脸眼睛区域的宽为左右眼眼角的距离,高为初始检测人脸矩形框高度的四分之一;人脸嘴部区域的宽为左右嘴角的宽度,宽为初始检测人脸矩形框高度的六分之一。
6.如权利要求1所述的方法,在所述S3中,所述输出年龄估计值包括:
S31:收集样本库,并标记每个样本的真实年龄;
S32:基于16层深度卷积神经网络对样本进行训练,得到参数模型;
S33:对输入人脸,输出各个年龄的概率,对年龄和对应的概率进行加权求和,得到的数值为最终的年龄估计值,并根据年龄区间将年龄分为幼年、少年、青年、中年以及老年。
7.如权利要求6所述的方法,其中所述样本库中的年龄区间为1~100岁,样本库中的样本来自IMDB-WIKI数据库,在所述数据库中,图片的标题记录了拍摄时间与对应人物的出生年月。
8.如权利要求6所述的方法,所述加权求和的公式为其中,yi为0~100岁的年龄预测概率,Oi为年龄。
9.如权利要求1所述的方法,在所述S3中,所述输出性别识别结果包括:
S41:收集样本库,并标记每个样本的真实性别;
S42:基于16层深度卷积神经网络对样本进行训练,得到参数模型;
S43:对输入人脸,输出性别识别的概率,概率高的即为性别识别结果。
10.如权利要求1所述的方法,所述S4中对人脸表情进行分类并输出各个表情的预测概率包括:
S51:收集样本库,并标记每个样本的表情属性,分别为不笑、微笑与大笑;
S52:基于VGG深度神经网络对样本进行训练,得到参数模型;
S53:输入人脸区域图片,输出各个表情属性的概率;
S54:基于S2提取的每个卷积层的特征,提取眼睛部位和嘴部的局部卷积特征;
S55:基于S2提取的每个卷积层的特征与眼睛嘴部卷积特征,利用随机森林算法对表情进行分类,输出各个表情的预测概率;
S56:将深度网络和随机森林算法的输出预测概率相加,依据相加后的预测概率将表情属性分为不笑、微笑与大笑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711498120.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:行人重识别系统的实现方法
- 下一篇:一种障碍物框合并方法、装置及终端