[发明专利]基于特征空间自适应投影的语音情感识别方法有效
申请号: | 201210250571.1 | 申请日: | 2012-07-19 |
公开(公告)号: | CN102779510A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 赵力;黄程韦;魏昕;包永强;余华 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。 | ||
搜索关键词: | 基于 特征 空间 自适应 投影 语音 情感 识别 方法 | ||
【主权项】:
1.一种基于特征空间自适应投影的语音情感识别方法,其特征在于,包括以下步骤:(1)特征提取:对于情感语音库中的每一条语音样本,提取基本的声学特征,对于第
个语音样本,
;(2)特征选择: (2-1)对于特定说话人的某一个情感特征,此处设为第
个特征,分别通过
种情感的高斯混合模型,
为待识别的情感类别数,得到
个高斯混合模型似然概率密度值,以高斯混合模型似然概率密度值映射到0到1之间作为第
个样本归属于第
个情感类别的隶属度
:
其中,
表示第i个样本的特征矢量在第j个情感类别模型参数下的似然值;(2-2)获得特定说话人的第
个特征归属于第
个情感类别的模糊熵
,其计算公式为:
其中,常数
取
,那么,对特定说话人的第
个特征的平均模糊熵为:
其中:
为情感类别数;(2-3)对特定说话人的第
个特征,当模糊熵
超过一定阈值
时,则认为此特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征,保留下来的特征组成最终选出的特征矢量,其中阈值
的取值范围为0.1~0.5;(3)训练:提取并选择出10维特征矢量以后,对于每一类情感所对应的所有训练数据,采用一个高斯混合模型来建模该类数据集中的数据分布,通过期望最大算法,并且基于情感数据的置信度,通过
值控制修正比例对待估计的参数进行修正,
,对于情感置信度高的训练样本,在参数迭代估计中的权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型,即,
, …… ,
,其中
为情感类别数;(4)识别:在识别过程中,首先直接计算选出的特征矢量,计算其关于每一类训练好的情感模型
, …… ,
的似然值
,… ,
,最终的识别结果为最大的似然值
所对应的情感,即:
其中,
表示第
个情感所对应的似然值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210250571.1/,转载请声明来源钻瓜专利网。
- 上一篇:带开盒拉手的包装盒
- 下一篇:包装机械用板块抓取翻转装置