[发明专利]用于预测脸部属性的方法和设备有效
申请号: | 201480083724.5 | 申请日: | 2014-12-12 |
公开(公告)号: | CN107004116B | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 汤晓鸥;刘子纬;罗平;王晓刚 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脸部图像 预测装置 预测 脸部位置 肩位置 方法和设备 第二位置 第一位置 属性标签 分类 | ||
1.一种用于预测脸部属性标签的设备,包括:
第一位置预测装置,用于预测输入的脸部图像中的头-肩位置;
第二位置预测装置,用于从预测的头-肩位置来预测所述输入的脸部图像中的脸部位置;
属性预测装置,用于从所述脸部位置提取一个或多个脸部表示,并且根据提取的脸部表示,对所述输入的脸部图像的所需属性进行分类,其中,所述第一位置预测装置、所述第二位置预测装置和所述属性预测装置包括神经网络;以及
训练器,所述训练器被配置成:
将通用对象数据集及其类别标注馈送到所述设备,调节所述第一位置预测装置、所述第二位置预测装置以及属性预测装置三者中神经网络的参数,以获取预先训练的脸部定位模型;
将脸部数据集及其身份标注馈送到所述设备,调节所述第一位置预测装置、所述第二位置预测装置以及属性预测装置三者中神经网络的参数,以获取预先训练的属性预测模型;以及
将获取的预先训练的脸部定位模型和预先训练的属性预测模型组合成最终模型。
2.根据权利要求1所述的设备,其中所述第一位置预测装置被配置成计算所述输入的脸部图像中的每个位置的测地距离,并且确定计算的距离是否大于预定阈值,如果是的话,那么所述第一位置预测装置确定出所述输入的图像中的此位置属于头-肩位置。
3.根据权利要求2所述的设备,其中基于所述输入的脸部图像中的每个位置的密度强度以及每个位置到所述输入的脸部图像中的最近位置之间的空间距离来确定所述测地距离。
4.根据权利要求1或2所述的设备,其中所述第一位置预测装置包括由多个最大池化层和多个卷积层构成的神经网络,其中所述卷积层被配置成具有全局共享的滤波器,所述滤波器循环地应用在所述脸部图像的每个位置,以平移和缩放所述输入的脸部图像。
5.根据权利要求1或2所述的设备,其中所述第二位置预测装置包括由多个最大池化层和多个卷积层构成的神经网络,其中所述卷积层被配置成具有全局共享的滤波器,所述滤波器循环地应用在所述图像的每个位置,以平移和缩放所述输入的脸部图像。
6.根据权利要求1或2所述的设备,其中所述属性预测装置包括多个卷积层,
其中每个所述卷积层被配置成具有用于平移和缩放所述输入的脸部图像的一个或多个滤波器,所述卷积层中的第一层和所述卷积层中的第二层处的所述滤波器是全局共享的,而所述卷积层中的第三层和第四层处的所述滤波器是局部共享的。
7.根据权利要求1或2所述的设备,其中所述属性预测装置包括多个卷积层和多个池化层,每个池化层连接到所述卷积层中的对应卷积层并且被配置成将接收的特征图划分成具有重叠单元的网格,使得下面的卷积层以交织方式平移和缩放所述输入的脸部图像的划分网格。
8.根据权利要求1或2所述的设备,其中所述属性预测装置包括多个卷积层以及全连接层,所述全连接层连接到所述卷积层的最后一层并且被配置成将由所述卷积层生成的、所述输入的图像的响应图变换成紧凑的鉴别性特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480083724.5/1.html,转载请声明来源钻瓜专利网。