[发明专利]一种基于标记分布的头部姿态估计方法在审
申请号: | 201310500424.X | 申请日: | 2013-10-22 |
公开(公告)号: | CN103530651A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 耿新;夏昱 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 江苏永衡昭辉律师事务所 32250 | 代理人: | 王斌 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标记 分布 头部 姿态 估计 方法 | ||
技术领域
本发明涉及模式识别、计算机视觉和机器学习,特别涉及标记分布学习和头部姿态估计。
背景技术
头部姿态估计是根据一幅人脸图像,估计出该图像中头部的偏转角度。头部姿态估计主要在两个方面有着十分重要的应用:(1)人机交互,智能机器通过估计头部姿态以及相邻时刻头部姿态的变化自动地做出不同的决策和操作(如:人通过头部的动作控制鼠标光标的移动,人通过头部姿态的变化向计算机下达命令);(2)为其他计算机视觉问题提供重要的预处理操作,人脸识别、人脸表情识别等计算机视觉问题需要提前知道头部的姿态,因此头部姿态估计精度的提升对其他计算机视觉问题的解决也有十分重要的意义。
我们提出的基于标记分布的头部姿态估计方法(如图1),在训练阶段使用一个标记分布(用向量表示)表示所有类别对该图像的描述程度,向量里的每一个元素表示对应类别对该图像的描述程度,称为描述度。如图3中,假设总共有五个类别(y1,y2,y3,y4,y5),如果一幅图像属于y3,训练中我们使用的类别信息并不是y3这个孤立的类别信息,而是生成一个标记分布[P(y1),P(y2),P(y3),P(y4),P(y5)]作为类别信息(注:标记分布向量中所有元素均大于等于0、小于等于1,且总和为1)。这样可以将更完整的类别信息用来训练模型。我们还考虑了头部姿态(类别)之间的相似性信息(如:我们普遍认为,同一个人的人脸图像中0°与1°的图像比0°与15°的图像更相似),利用这种相似性信息使头部姿态估计效果进一步提升。
在对目标函数进行优化的时候,我们使用了l-bfgs算法(具体可参考:Dong C.Liu and Jorge Nocedal,On the limited memory BFGS method for large scaleoptimization,Mathematical Programming,45(1-3),PP:503-528,1989.),使训练参数模型的时候速度快、占用内存少,特别适合目标函数中待优化参数特别多(大于10000)的情况。
发明内容
本发明的目的是提供一种新的头部姿态估计方法(如图1),该方法对头部姿态估计的精度已经大幅超过人类的估计水平(在本文的“具体实施方式”部分会更详细解释这一点)。本发明的技术方案为:一种基于类别分布的头部姿态估计方法,包括以下步骤:
步骤S1,获取用于训练的头部姿态的图像集,将图像集中的每幅图像的人脸部分裁剪出来,裁剪掉头发、脖子、背景等部分,使图像中只剩下人脸;
步骤S2,将图像集中的所有图像缩放到统一大小的分辨率(如:32×32像素);
步骤S3,使用梯度直方图方法(具体可参考:N.Dalal and B.Triggs,Histograms of oriented gradients for human detection,IEEE Computer Society Conference on Computer Vision and Pattern Recognition,PP:886-893,San Diego,USA,2005.)从步骤S2中缩放后的图像中提取出图像特征向量;
步骤S4,收集每幅图像正确的类别(头部姿态)信息,根据每幅图像的类别信息以及类别之间的关系(头部姿态类别差异可以量化,如:-90°与90°之间相差180°,0°与15°之间相差15°),给予每幅图像一个标记分布(如图3);
步骤S5,根据头部姿态的类别之间的关系,赋予每个类别一个平滑权重向量,如图4中(实线表示使用步骤S4计算出来的标记分布,P(yi)是该向量中类别yi对应的描述度,虚线表示使用模型预测出来的标记分布,f(yi)表示类别yi对应的描述度,类别yi-1和类别yi+1是类别yi相邻的类别),计算真实的标记分布向量中P(yi)与模型估计出来的标记分布向量中f(yi)差异时,同时考虑进P(yi)与f(yi-1)、f(yi)以及f(yi+1)的差异;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310500424.X/2.html,转载请声明来源钻瓜专利网。