[发明专利]基于视频序列的人脸表情识别方法有效

专利信息
申请号: 201510612526.X 申请日: 2015-09-23
公开(公告)号: CN105139004B 公开(公告)日: 2018-02-06
发明(设计)人: 于明;郭迎春;师硕;于洋;刘依;阎刚;邓玉娟 申请(专利权)人: 河北工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06K9/66
代理公司: 天津翰林知识产权代理事务所(普通合伙)12210 代理人: 胡安朋
地址: 300130 天津市红桥区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明基于视频序列的人脸表情识别方法,涉及用于识别图形的方法,是一种利用HCBP‑TOP算法提取人脸表情序列的动态时空纹理特征的人脸表情识别方法,步骤是人脸表情序列预处理;采用空间金字塔分割方式对人脸表情序列图像分层分块处理;利用HCBP‑TOP算法提取人脸表情序列图像的动态时空纹理特征;采用SVM分类器进行人脸表情的训练和预测。本发明方法克服了现有技术没有考虑中心像素,忽视局部细节信息,人脸表情识别的效率和识别精度均较低,不具有普遍的适用性的缺陷。
搜索关键词: 基于 视频 序列 表情 识别 方法
【主权项】:
基于视频序列的人脸表情识别方法,其特征在于:是一种利用HCBP‑TOP算法提取人脸表情序列的动态时空纹理特征的人脸表情识别方法,具体步骤如下:第一步,人脸表情序列图像预处理:(1)人脸表情序列图像裁剪:将从已有人脸表情视频序列数据库读取到的人脸表情序列图像由RBG空间转化到灰度空间,采用的公式(1)如下:Gray=0.299R+0.587G+0.114B          (1),其中,Gray为灰度值,范围从0到255,R为红色分量,G为绿色分量,B为蓝色分量,根据人脸面部“三庭五眼”的特征和人脸的几何模型,对转化到灰度空间的人脸表情序列图像进行裁剪,设双眼之间的水平距离为d,以两眼连线的中点为基准点,向上距离基准点0.55d处定为上边界,向下距离基准点1.45d处定为下边界,向左距离0.9d处定为左边界,向右距离0.9d处定为右边界,由此完成人脸表情序列图像裁剪;(2)人脸表情序列图像缩放:对上述“(1)人脸表情序列图像裁剪”裁剪后的人脸表情序列采用双三次插值算法改变图像的尺度,实现尺度归一化,以进行人脸表情序列图像缩放,经过人脸表情序列缩放后的人脸图像大小为64×64像素;(3)人脸表情序列图像灰度均衡化:采用直方图均衡化对上述“(2)人脸表情序列图像缩放”处理得到的人脸表情序列图像进行灰度处理,至此完成人脸表情序列图像预处理;第二步,采用空间金字塔分割方式对人脸表情序列图像分层分块处理:空间金字塔分割即在空间上对图像进行逐步细分,这里采用的空间金字塔分割方式是在人脸表情序列图像的水平和竖直两个标准坐标方向上进行2的指数倍数的划分,设金字塔的总层数为L+1,金字塔各层的层数i分别为0,1,2,…,L,金字塔第i层的分割方法为:在水平标准坐标方向把人脸表情序列图像划分为2i块,在竖直标准坐标方向把人脸表情序列图像划分为2i块,最终将人脸表情序列图像划分为2i×2i块,这里设定上述L=2,即利用空间金字塔分割方式把第一步中预处理后的人脸表情序列图像分成2+1层,第零层为原人脸表情序列图像,第i层把原人脸表情序列图像分成2i×2i的子块,i=1,2;第三步,利用HCBP‑TOP算法提取人脸表情序列图像的动态时空纹理特征:利用HCBP‑TOP算法对人脸表情序列图像进行分层分块的动态时空域纹理特征的提取,所述的“分层分块”是上述第二步中得到的人脸表情序列图像分层分块,经过第二步空间金字塔分割方式对人脸表情序列图像分层分块处理后,进一步用HCBP‑TOP算法获取到每个子块X轴、Y轴、时间T轴三个维度的特征向量,并组合拼接成块内整体特征向量,再将整幅图像内的所有块的特征向量整合,形成一幅图像某个分层上的特征数据,最后将金字塔的各层人脸表情序列图像的动态时空纹理特征直方图按照权重分配串联成整个人脸表情序列图像的动态时空纹理特征直方图,具体方法如下:(1)提取图像子块的HCBP特征:在每一层中,利用HCBP‑TOP算法对每个序列中对应位置的子块上提取图像子块的HCBP特征,对该子块进行人脸表情序列图像的动态时空纹理特征的直方图统计,然后将所有子块的人脸表情序列图像的动态时空纹理特征直方图串联成整个人脸表情序列中各层的人脸表情序列图像的动态时空纹理特征直方图,即获取人脸表情序列在X‑Y平面的形变信息和在X‑T平面和Y‑T平面的运动信息,提取过程是通过如下HCBP编码计算的:8组HCBP编码模型M1‑M8如公式(2)所示:上式中每组模型中最外层5个像素被设定权重为1,相邻的第二外层5个像素被设定权值为‑1,其他部分被设定权重为0,中心点P0用来记录存储Haar‑like型特征的纹理变化,在X‑Y、X‑T、Y‑T每个平面上以P0为中心构成了一个如公式(3)所示5×5的小窗口,周围有24个邻域点P1,P2,…,P24,由以上描述可知,图像序列I中的任意一个像素点I(x,y,t)在其四周存在小窗Wj(x,y),j=0,1,2,W0(x,y)表示该像素点在X‑Y平面上对应的小窗口,W1(x,y)表示该像素点在X‑Z平面上对应的小窗口,W2(x,y)表示该像素点在Y‑Z平面上对应的小窗口,Wj(x,y)的HCBP值fj(x,y,t)的计算公式如下式:其中,aj,k=Mk·Wj(x,y)           (7),Mk为编码模型,Ck为每个编码模型中权值不为零的像素求和模型,Ck=|Mk|,B(x)为HCBP值的阈值比较函数,Tj,k为阈值,aj,k为小窗Wj(x,y)和编码模型Mk卷积后得到的十进制数;对每个图像子块利用模型M1‑M8对图像区域像素进行扫描,模型窗口大小为5×5像素,每个模型对应一个阈值,阈值的计算方法为,先计算每个模型中10个权值不为零像素与中心像素共11个像素的和,即Ck·Wj(x,y),然后求出这11个像素的平均值,每个模型的阈值为中心像素与平均值的差值的5倍,然后利用公式(4)计算人脸表情序列的动态时空纹理特征,权值为1的5个像素值的和减去权值为‑1的5个像素值的和,即外侧向里侧的变化信息,得到一个十进制数aj,k,将aj,k与阈值Tj,k比较,若aj,k大于阈值则HCBP‑TOP码值为1,否则计为0;(2)提取人脸表情序列图像的动态时空纹理HCBP‑TOP特征:利用HCBP‑TOP算法对第二步生成的分层金字塔子块提取人脸表情序列图像的动态时空纹理特征,根据“上述(1)提取图像子块的HCBP特征”中提取图像子块的HCBP特征计算每块内的人脸表情序列图像的动态时空纹理HCBP‑TOP特征,每个子块X、Y、T三个维度的在XY、XT、YT方向上的HCBP特征向量组合拼接成块内整体特征向量HCBP‑TOP,再将整幅图像内的所有块的特征向量整合,形成一幅图像某个分层上的特征数据,根据直方图函数得到某层的特征直方图,由于图像分类时各层图像的空间信息不同和各层图像块在图像分类时所起到的作用不同,将金字塔的各层人脸表情序列图像的动态时空纹理特征直方图按照权重分配串联成整个人脸表情序列图像的动态时空纹理特征直方图,权重分配原则为大尺度的子块所属的图层的人脸表情序列图像的动态时空纹理特征直方图权重小,而小尺度的子块所属的图层的人脸表情序列图像的动态时空纹理特征直方图权重大,定义金字塔第i层的人脸表情序列图像的动态时空纹理特征直方图的权重为i+1,则第零层原图特征直方图分配的权重为1,第一层特征直方图分配的权重为2,随着层数越大,该层特征直方图分配的权重越大,即该层特征信息在总特征表示中的比重就越大;然后将各层人脸表情序列图像的动态时空纹理特征直方图根据划分的权重组合拼接成整体图像的人脸表情序列图像的动态时空纹理特征直方图,其中第i层的子块个数为2i×2i,每个子块的人脸表情序列图像的动态时空纹理特征取值范围为0到255,并经过规范化处理得到最终的人脸表情序列图像的动态时空纹理特征表示,将提取到的人脸表情序列图像的动态时空纹理特征数据输入SVM中训练分类器;所述HCBP‑TOP算法,是采用CBP特征和Haar‑like特征相结合的算法,对同频率的子图像序列用HCBP‑TOP算法提取分块的人脸表情序列的动态时空纹理特征,其中HCBP‑TOP直方图定义如下:其中:fn(x,y,t)表示第n 平面上像素点I(x,y,t)的HCBP值,n=0时当前平面是XY平面;n=1时当前平面是XT平面;n=2时当前平面是YT平面,函数E{f}的定义如下:第四步,采用SVM分类器进行人脸表情的训练和预测:将第三步提取到的人脸表情序列图像的动态时空纹理特征数据输入SVM训练分类器进行人脸表情的训练和预测,判断提取的人脸表情序列图像的动态时空纹理特征究竟属于哪类人脸表情,采用留一法,取实验的平均结果为表情识别率,具体操作流程如下:(1)将上述第三步提取到的人脸表情序列图像的动态时空纹理特征数据输入SVM训练分类器,根据这些人脸表情序列图像的动态时空纹理特征样本构造出与训练样本人脸表情序列图像的动态时空纹理特征矩阵和测试样本人脸表情序列图像的动态时空纹理特征矩阵分别对应的训练和测试类别样本矩阵,该训练和测试类别样本矩阵中的值为样本的分类类别;(2)针对局部人脸表情序列图像的动态时空纹理特征采用自定义核函数,采用交叉验证选择最佳参数c与g,拉格朗日因子c=790,g=1.9,首先将训练样本人脸表情序列图像的动态时空纹理特征矩阵和测试样本人脸表情序列图像的动态时空纹理特征矩阵送入svmtrain函数得到支持向量,再将测试样本人脸表情序列图像的动态时空纹理特征矩阵和上述支持向量送入svmpredict函数中进行预测,由此完成人脸表情识别,在Cohn‑Kanade库和SFEW库中实验得到生气、厌恶、害怕、高兴、伤心和惊讶6种表情,由此完成人脸表情的识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510612526.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top