[发明专利]基于表情的背景音乐控制方法及装置有效
申请号: | 201210268505.7 | 申请日: | 2012-07-30 |
公开(公告)号: | CN102750964A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 郭雷;陈智慧;赵天云 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G11B19/02 | 分类号: | G11B19/02;G06K9/00 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 表情 背景音乐 控制 方法 装置 | ||
1.一种基于表情的背景音乐控制方法,其特征在于步骤如下:
步骤1:将采集的人脸24位真彩色图像进行灰度化处理,灰度化算法采用加权平均值法:f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j);式中:f(i,j)为转换后的灰度图像在(i,j)处的灰度值,R(i,j)为原图像在(i,j)处的R分量灰度值,G(i,j)为原图像在(i,j)处的G分量灰度值,B(i,j)为原图像在(i,j)处的B分量灰度值;
步骤2:利用积分图像算法提取灰度化处理后图像的Haar特征,将提取的图像Haar特征通过级联分类器来检测图像中的人脸区域;所述级联分类器是利用样本图像的人脸Haar特征,采用AdaBoost分类算法进行分类器训练后得到的;
步骤3:设人脸区域的高度为h,宽度为w,取左上角点为原点,取两眼窗的起始坐标为:左眼右眼两眼窗的大小为
步骤4:对两眼窗内区域的图像做直方图分析,留取灰度最低的5%像素,其余部分灰度值置为255,然后将窗内图像作水平投影,得到一条一维曲线;一维曲线上出现的两个波谷自上而下分别代表眉毛区域和眼睛区域,眼睛区域波谷的谷点位置作为眼睛的纵坐标;所述窗内图像水平投影函数为:式中I(x,y)为在(x,y)点的灰度值,N为投影像素点数;
步骤5:将眉毛区域的灰度值置为255,然后将两眼窗内图像做垂直投影,得到一条一维曲线,曲线左右波峰的峰点位置作为左右眼睛的横坐标;所述垂直投影函数为:式中I(x,y)为在(x,y)点的灰度值,N为投影像素点数;
步骤6:连接步骤4和步骤5得到的两眼坐标,以两眼坐标的连线中点作为坐标原点,建立人脸图像坐标系,旋转人脸图像使双眼为水平位置;
步骤7:根据人脸的面部比例特征确定嘴巴的位置并取嘴巴窗,嘴巴窗的起始坐标为窗的大小为将嘴巴窗内图像做水平投影,取投影所得的曲线的最小值作为嘴巴在垂直方向上的坐标;设两眼之间距离为k,两眼中心到嘴巴的距离为g,以两眼距离中心为中心,左右取向上取往下取得到一个切割后的人脸图像;
步骤8:将人脸图像放缩到100×100像素,得到人脸图像的二维矩阵M[k][g],其中k=100,g=100;对二维矩阵灰度归一化处理,得到具有相同的均值和方差的人脸图像;所述灰度归一化处理公式:式中μ0和σ0是变换后图像的均值和标准差,和是变换前图像的均值和标准差;
步骤9:取像素点数宽为P,长为L的采样窗,滑动步长为4×4,从左到右,从上向下在步骤8处理后的人脸图像上滑动,获取采样图像块,然后,对于每个图像块采用8点的二维离散余弦变换公式进行变换,
式中M=N=8,
得到二维离散余弦变换系数C(u,v)取变换系数的低频部分4×4系数作为嵌入式隐马尔可夫模型的观察向量序列;所述P×L为16×16;
步骤13:使用前向-后向算法Forward-Backward Algorithm,将步骤9中得到的观察向量序列分别与训练完成的“快乐”“正常”“难过”三种表情的嵌入式隐马尔可夫模型观察向量序列的似然概率值,选择似然概率值最高的模型作为采集图像中人脸的表情信息所属类别;
所述训练“快乐”“正常”“难过”三种表情的嵌入式隐马尔可夫模型的步骤:
“快乐”的嵌入式隐马尔可夫模型训练:选择“快乐”表情的样本图像,其中“快乐”表情指6种基本表情中惊奇和高兴的表情;取超级状态的个数为5,分别是额头、眼睛、鼻子、嘴和下巴五大部分;将超级状态中嵌入状态的个数定义为{3,5,3,5,3},训练“快乐”表情的嵌入式隐马尔可夫模型;
“难过”的嵌入式隐马尔可夫模型训练:选择“难过”表情的样本图像,其中“难过”表情指6种基本表情中愤怒和悲伤的表情;取超级状态的个数为5,分别是额头、眼睛、鼻子、嘴和下巴五大部分;将超级状态中嵌入状态的个数定义为{3,5,3,5,3},训练“难过”表情的嵌入式隐马尔可夫模型;
“正常”的嵌入式隐马尔可夫模型训练:选择“正常”表情的样本图像,其中“正常”表情指不包括在“快乐”和“难过”表情中的其他表情;取超级状态的个数为5,分别是额头、眼睛、鼻子、嘴和下巴五大部分;将超级状态中嵌入状态的个数定义为{3,5,3,5,3},训练“正常”表情的嵌入式隐马尔可夫模型;
所述三种表情的样本图像选自卡内基梅隆大学的Cohn-Kanade表情数据库;
步骤14:当识别的表情信息所属类别为“快乐”时,将背景音乐提高音量5分贝,加大重低音3分贝,提高高音3分贝,开启环绕声;
当识别的表情信息所属类别为“正常”时,将背景音乐降低音量至45分贝,降低重低音至30分贝,降低高音至25分贝,开启环绕声;
当识别的表情信息所属类别为“难过”时,将背景音乐降低音量5分贝,关闭重低音,降低高音至20分贝,关闭环绕声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210268505.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能清洁用具
- 下一篇:一种可伸缩的三角形拐杖