[发明专利]基于深度图像的三维人脸描述方法有效

申请号：	201410182357.6	申请日：	2014-04-30
公开（公告）号：	CN103971122B	公开（公告）日：	2018-04-17
发明（设计）人：	夏春秋	申请（专利权）人：	深圳市唯特视科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46
代理公司：	深圳市翼智博知识产权事务所(普通合伙)44320	代理人：	彭年才
地址：	518116 广东省深圳市高新技术产业园***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于深度图像的三维人脸描述方法，包括选取三维人脸数据表情鲁棒区域；利用预定义好的不同尺度和方向的盖博滤波器系数对选择单元所选取的三维人脸数据进行不同尺度和方向的响应计算；利用训练集中的三维人脸图像的盖博响应向量集合，通过聚类算法，以其聚类中心作为视觉词汇，将所有的词汇汇集在一起获取视觉词典，所述聚类算法为K均值算法；获得通过计算得到的每个像素获得的盖博响应向量，并将其与视觉词典进行直方图映射，从而得到视觉词典直方图。本发明兼顾深度三维人脸数据细节纹理有效性和全局纹理鲁棒性，有效提升三维人脸特征向量的描述能力。
搜索关键词：	基于深度图像三维描述方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于深度图像的三维人脸描述方法，其特征在于，包括如下步骤：选择步骤，由选择单元选取三维人脸数据表情鲁棒区域；盖博响应计算步骤，第一数据计算单元利用预定义好并存储于第一存储单元中的不同尺度和方向的盖博滤波器系数对选择单元所选取的三维人脸数据进行不同尺度和方向的响应计算；获取视觉词典步骤，利用训练集中的三维人脸图像的盖博响应向量集合，通过聚类算法，以其聚类中心作为视觉词汇，将所有的词汇汇集在一起获取视觉词典，所述聚类算法为K均值算法，包括如下步骤：步骤1，对于数据对象集，任意选取K个对象作为初始的类中心；步骤2，根据类中对象的平均值，将每个对象重新赋给最相似的类；步骤3，更新类的平均值，即计算每个类中对象的平均值；步骤4，跳回步骤2，循环进行步骤2和步骤3，直至所得平均值不再发生变化即停止；直方图映射步骤，由第二计算单元获得第一数据计算单元通过计算得到的每个像素获得的盖博响应向量，并将其与从第二存储单元中读取到的视觉词典进行直方图映射，从而得到视觉词典直方图，通过计算每个像素盖博响应后的向量与其距离最近的视觉词汇，构建基于视觉词典的直方图描述，第二储存单元中存储的聚类中心为m个，则得到的对于三维人脸数据的直方图描述向量也为m维，所述直方图映射步骤的具体步骤如下：将三维人脸深度图像分割成一些局部纹理区域；对每个盖博滤波响应向量，按照位置的不同将其映射到其对应的视觉分词典的词汇中，并以此为基础建立视觉词典直方图向量作为三维人脸的特征表达；最近邻分类器被用来作为最后的人脸识别，并以L1距离作为距离度量，所述L1距离的定义为。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司，未经深圳市唯特视科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410182357.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度图像的三维人脸描述方法有效

专利文献下载