[发明专利]对人体面部微笑表情深度卷积神经网络的检测方法有效
申请号: | 201610089191.2 | 申请日: | 2016-02-17 |
公开(公告)号: | CN105608447B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 马苗;朱青青;郑雪;孙莉;裴炤;郭敏 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人体 面部 微笑 表情 深度 卷积 神经网络 检测 方法 | ||
1.一种对人体面部微笑表情深度卷积神经网络的检测方法,它是由训练步骤和测试步骤组成,所述的训练步骤为:
(1)对训练样本图像进行预处理
包括图像灰度化、嘴巴子图定位、大小归一化以及亮度调节步骤;
图像灰度化:用(1)式对被训练的样本图像进行灰度化处理,将彩色图像转为灰度图像:
I=Wr×R+Wg×G+Wb×B (1)
式中I为灰度化后的亮度,R为彩色图像的红色分量,G为彩色图像的绿色分量,B为彩色图像的蓝色分量,Wr为彩色图像的红色分量的权重,Wg为彩色图像的绿色分量的权重,Wb为彩色图像的蓝色分量的权重;
嘴巴子图定位:用左眼、右眼、左嘴角、右嘴角、鼻子五个关键点横坐标的平均值作为中心点的横坐标x,用左眼、右眼、左嘴角、右嘴角、鼻子五个关键点纵坐标的平均值作为中心点的纵坐标y,用欧式距离或曼哈顿距离或棋盘距离计算五个关键点到中心点的距离;计算上述五个距离的最大距离D或平均距离D或最小距离D,以((x-(0.75~0.77)D),y)为左上角,裁剪成宽为(1.5~1.58)D、高为(1.7~1.78)D的矩形,得到嘴巴子图;
嘴巴子图大小归一化:将上述嘴巴子图用双三次插值法或B样条插值法或三次样条插值法或等距插值法或四次样条插值法或拉格朗日插值法,归一化为32×32嘴巴子图,像素总个数为322;
对嘴巴子图进行亮度调节:采用自适应亮度调节法或分段线性拉伸法或直方图均衡化算法,获得亮度调节后的嘴巴子图;
自适应亮度调节法,用(4)式计算32×32嘴巴子图的直方图h(x)累加和与像素总个数的比值cdf(x):
式中x∈[0,255],在cdf(x)中寻找第一个大于0.01的索引值ilow和第一个大于0.99的索引值ihigh;
用(5)式得到亮度范围[low,high]:
low=(ilow-1)/255,high=(ihigh-1)/255 (5)
用(6)式计算调节后的亮度值J
J=(tmp-low)/(high-low) (6)
式中tmp=max(low,min(high,I)),I为灰度化后的亮度,得到32×32标准嘴巴图像;
(2)训练卷积神经网络
将训练样本预处理后得到的32×32标准嘴巴图像输入卷积神经网络,经前向传播和反向传播两个步骤反复循环至达到设定的最大迭代次数,得到卷积神经网络和训练样本的多尺度特征,所述的卷积神经网络的结构为:输入层是32×32的标准嘴巴图像;C1层是第一个卷积层,有10个28×28的特征图,每个特征图中的1个像素点与输入层的1个5×5区域相连接,共(5×5+1)×10=260个训练参数;S2层是下2采样层,有10个14×14特征图,每个特征图中的1个像素点与C1层相应特征图的1个2×2区域相连接,共1×10个偏置参数;C3层是第二个卷积层,有12个10×10的特征图,每个特征图中的1个像素点与S2层相应的1个5×5区域相连接,共(5×5+1)×10×12=3120个参数;S4层为第二个下2采样层,有12个5×5的特征图,共1×12个偏置参数;F5层是S4中12个5×5的特征图以列序为主序依次排列生成的1个300维的多尺度特征;输出层由2个结点1和0组成,F5层与输出层之间全连接,共300×2=600个参数;该深度卷积神经网络共260+10+3120+12+600=4002个参数,通过前向传播和反向传播反复循环至达到设定的最大迭代次数,确定网络参数;
(3)训练支持向量机分类器
把多尺度特征输入支持向量机,支持向量机根据多尺度特征寻找最优分类超平面,得到支持向量机分类器,该分类器的输出是1或0,1为微笑,0为不微笑;
所述的测试步骤为:
(1)对测试样本图像进行预处理
测试样本图像的预处理与对训练样本图像进行预处理步骤(1)相同;
(2)用预处理后的测试样本输入到卷积神经网络中,提取测试样本的多尺度特征;
(3)将多尺度特征输入到支持向量机分类器中,得到检测结果,即是否微笑。
2.根据权利要求1所述的对人体面部微笑表情深度卷积神经网络的检测方法,其特征在于所述的支持向量机为:支持向量机的核函数选择径向基函数,其参数gamma=0.05,支持向量机的输入是从卷积神经网络得到的多尺度特征,输出是1或0,1为微笑,0为不微笑。
3.根据权利要求1所述的对人体面部微笑表情深度卷积神经网络的检测方法,其特征在于所述的多尺度特征的生成过程为:将32×32的标准嘴巴图像输入到卷积神经网络的输入层中,经C1层、S2层、C3层和S4层的2次卷积和下2采样,得到12个5×5的特征图,以列序为主序依次排列生成的1个300维的多尺度特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610089191.2/1.html,转载请声明来源钻瓜专利网。