[发明专利]基于特征空间自适应投影的语音情感识别方法有效

申请号：	201210250571.1	申请日：	2012-07-19
公开（公告）号：	CN102779510A	公开（公告）日：	2012-11-14
发明（设计）人：	赵力;黄程韦;魏昕;包永强;余华	申请（专利权）人：	东南大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	许方
地址：	210096***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于特征空间自适应投影的语音情感识别方法，属于语音信号处理领域。本发明首先对语音进行特征提取，并且计算每个特征的模糊熵，当该特征的模糊熵小于预先设定好的阈值时，则认为该特征与一般模型的差异较大，应该进行投影压缩，即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化，从而训练出对于每一类情感所对应的高斯混合模型；最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征，从而提高语音情感识别率。
搜索关键词：	基于特征空间自适应投影语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于特征空间自适应投影的语音情感识别方法，其特征在于，包括以下步骤：（1）特征提取：对于情感语音库中的每一条语音样本，提取基本的声学特征，对于第个语音样本，；（2）特征选择：（2-1）对于特定说话人的某一个情感特征，此处设为第个特征，分别通过种情感的高斯混合模型，为待识别的情感类别数，得到个高斯混合模型似然概率密度值，以高斯混合模型似然概率密度值映射到0到1之间作为第个样本归属于第个情感类别的隶属度：其中，表示第i个样本的特征矢量在第j个情感类别模型参数下的似然值；（2-2）获得特定说话人的第个特征归属于第个情感类别的模糊熵，其计算公式为：其中，常数取，那么，对特定说话人的第个特征的平均模糊熵为：其中：为情感类别数；（2-3）对特定说话人的第个特征，当模糊熵超过一定阈值时，则认为此特征与一般模型的差异较大，应该进行投影压缩，即在特征矢量中删除此特征，保留下来的特征组成最终选出的特征矢量，其中阈值的取值范围为0.1～0.5；（3）训练：提取并选择出10维特征矢量以后，对于每一类情感所对应的所有训练数据，采用一个高斯混合模型来建模该类数据集中的数据分布，通过期望最大算法，并且基于情感数据的置信度，通过值控制修正比例对待估计的参数进行修正，，对于情感置信度高的训练样本，在参数迭代估计中的权重进行强化，从而训练出对于每一类情感所对应的高斯混合模型，即，, …… ,，其中为情感类别数；（4）识别：在识别过程中，首先直接计算选出的特征矢量，计算其关于每一类训练好的情感模型, …… ,的似然值，… ，，最终的识别结果为最大的似然值所对应的情感，即：其中，表示第个情感所对应的似然值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210250571.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于特征空间自适应投影的语音情感识别方法有效

专利文献下载