[发明专利]一种基于变分模态分解和极限学习机的语音情感识别方法在审
申请号: | 201810320085.X | 申请日: | 2018-04-11 |
公开(公告)号: | CN108597540A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 张秀再;王玮蔚;赵慧 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/24;G10L25/21;G10L25/18 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱桢荣 |
地址: | 210044 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分模 分解 极限学习机 情感特征 语音情感 传统语音 语音信号 残差 预处理 本征模态函数 人工智能 分类识别 情感语音 信号提取 语音识别 语音特征 识别率 新特征 原序列 构建 去除 聚合 保留 | ||
1.一种基于变分模态分解和极限学习机的语音情感识别方法,其特征在于,包括以下步骤:
步骤1、将输入的语音情感信号通过变分模态分解算法进行模态分解,得到本征模态函数IMF分量和残差分量;
步骤2、对步骤1的各分量进行Hlibert变换,得到各IMF分量的Hilbert谱,将各IMF分量的平均瞬时频率、幅值以及原始信号的瞬时频率作为该语音情感信号的VMD-HT特征;
步骤3、采用步骤1的各IMF分量进行重新聚合,对聚合信号提取MFCC参数,即得到VMD-MFCC特征;
步骤4、将步骤2和步骤3的特征加入到现有的语音特征集中,通过极限学习机分类模型对整个语音特征集进行分类识别,得到语音情感数据集分类结果。
2.根据权利要求1所述的一种基于变分模态分解和极限学习机的语音情感识别方法,其特征在于,步骤1中得到K个本征模态函数IMF分量和一个残差分量;具体如下:
第k个IMF分量表达式为
其中,uk(t)为第k个IMF分量,0<k<K+1,Ak(t)为第k个IMF分量的幅值,为第k个IMF分量的相角,t为时间;
约束条件为
式(2)中{uk}:={u1,...,uK},uk(t)记为uk,{uk}为分解到的K个有限带宽的IMF分量的集合,uk表示分解到的第k个有限带宽的IMF分量,为微分算子,δ(t)为狄利克来函数,j为虚数符号,e为自然常数,f(t)为约束函数,{ωk}:={ω1,...,ωK},{ωk}为K个IMF分量所对应的中心频率的集合,ωk表示第k个IMF分量所对应的中心频率,表示范数;通过拉格朗日函数求该约束条件下的最优解,生成的拉格朗日表达式为:
式(3)中,L({uk},{ωk},λ)为拉格朗日函数,α为惩罚系数,λ(t)为拉格朗日乘子,<·>表示内积;
采用乘法算子交替的方法求式(3)的鞍点,就得到IMF分量,求解过程中的值会不断更新,直到与的误差小于预设值;为第n+1次迭代的第k个IMF分量,其表达式为
式(4)中,X为uk的集合,为第n+1次迭代的第k个IMF分量的中心频率,表示将第n+1次迭代的除了第k个IMF分量之外的分量进行求和,ui(t)n+1为第n+1次迭代时的第i个IMF分量。
3.根据权利要求2所述的一种基于变分模态分解和极限学习机的语音情感识别方法,其特征在于,K设置为4。
4.根据权利要求1所述的一种基于变分模态分解和极限学习机的语音情感识别方法,其特征在于,步骤3的MFCC参数提取前12维。
5.根据权利要求1所述的一种基于变分模态分解和极限学习机的语音情感识别方法,其特征在于,步骤4的极限学习机分类模型采用sigmod函数作为代价函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810320085.X/1.html,转载请声明来源钻瓜专利网。