[发明专利]基于多特征点集活动形状模型的头部姿态估计方法有效
申请号: | 201410107868.1 | 申请日: | 2014-03-21 |
公开(公告)号: | CN103870843B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 佘青山;杨伟健;陈希豪 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 活动 形状 模型 头部 姿态 估计 方法 | ||
技术领域
本发明属于计算机模式识别、计算机视觉和人机交互领域,涉及一种人脸图像的头部姿态估计方法,尤其涉及一种基于多特征点集活动形状模型的头部姿态估计方法。
背景技术
头部姿态蕴含着丰富的人类情感信息,可以很好地表达人类内心深处的真实想法。因此,头部姿态估计在计算机视觉领域有着很大的研究和应用价值,是智能视频监控、虚拟现实、模式识别以及人机交互等领域研究中的重要环节,其姿态估计结果将直接影响到最终系统的稳定性。
目前要想让计算机具备人一样的识别能力还是很有难度的。在机器视觉中,头部姿态估计要能从数字图像中检测和定位出一个人的头部位置,这需要大量的算法处理过程,才能将图像上的像素特征转变成数据的表现形式。目前,国内外对头部姿态估计的研究提出了众多方法,主要分为二大类:基于图像的方法和基于模型的方法。基于图像方法主要是先通过主元分析或流行学习等算法将人脸图像数据进行降维,再在低维空间对头部姿态进行估计;基于模型方法主要分为模型的训练和搜索两个阶段,将不同头部姿态的训练样本进行形状和纹理特征的参数化,并以参数化模型的方式来表达,然后基于这些特征模型对头部姿态进行估计。
然而,在这些过程中,由于受到头部姿态千变万化,摄像机的失真、光照等环境因素,还有人物外观和表情以及诸如帽子和眼镜遮挡等因素的影响,特征点的定位往往不够稳定,因而会影响到最终头部姿态估计的准确性。正因为此,头部姿态估计始终是一个极富挑战性的课题。
发明内容
本发明所要解决的技术问题在于提供一种基于多特征点集活动形状模型的头部姿态估计方法,能够降低因少数特征点定位不准对头部姿态估计造成的影响,同时对光照还具有较强的鲁棒性,能够估计出正面、左转、右转、抬头和低头五种头部姿态。
本发明主要根据活动形状模型(Active Shape Model,ASM)算法拟合的对应人脸特征点集在数帧间的位移量,估计出头部姿态,头部姿态的基本思路是:以首帧拟合的正面人脸特征点作为基准点,先通过判断数帧内所有对应特征点在上下左右四个方向上的位移量大小是否超过设定的位移阈值,再统计超过设定位移阈值的特征点数,若大部分特征点都超过某一方向的位移阈值,则说明头部倾向于向这个方向摆动,否则说明头部还处于正面。
为了实现最终的头部姿态估计,本发明提供了一种基于多特征点集活动形状模型的头部姿态估计方法,主要包括如下步骤:
步骤(1)训练ASM模型。训练人脸样本分别得到ASM全局形状模型和局部纹理模型。
步骤(2)采集人脸图像序列。通过光学镜头或CMOS图像传感器组件获取人脸图像序列。
步骤(3)当前帧数判断。如果当前帧等于l的整数倍,则进入步骤(4);否则,跳至步骤(2),l表示帧数。
步骤(4)拟合人脸特征点。具体是:利用步骤(1)获得的ASM全局形状模型和局部纹理模型对步骤(2)采集的人脸图像序列进行n个人脸特征点拟合,将特征点对应的横、纵坐标记录到数组temp_x[n]和temp_y[n]中。
步骤(5)更新基准坐标。具体是:如果步骤(7)估计出的姿态为正脸,则根据公式(1)和(2)更新基准坐标;否则,直接跳到步骤(6)。
fiducial_x[i]=temp_x[i],i∈(0,1,...,n-1) (1)
fiducial_y[i]=temp_y[i],i∈(0,1,...,n-1) (2)
这里,基准坐标fiducial_x[n]、fiducial_y[n]分别表示更新后的n个正面人脸特征点对应的横、纵坐标。初始化时,将首帧拟合得到的n个正面人脸特征点横纵坐标作为基准坐标。
步骤(6)计算各个特征点的位移量并统计出超过位移阈值的特征点数。具体是:将步骤(4)中的人脸特征点坐标分别与基准坐标作差得到每个特征点在x、y轴方向上的位移量,若该位移量超过位移阈值Throffset,则该方向移动的特征点数加1。
位移阈值的计算公式为
Throffset=η×widthface (3)
式中,η是比例因子,当η∈[0.08,0.12]时可获得较好效果;widthface是拟合人脸的宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410107868.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:含有氢氧化镁的难燃性油漆
- 下一篇:一种视频游动字幕的自动检测方法和装置