[发明专利]基于特征空间自适应投影的语音情感识别方法有效

专利信息
申请号: 201210250571.1 申请日: 2012-07-19
公开(公告)号: CN102779510A 公开(公告)日: 2012-11-14
发明(设计)人: 赵力;黄程韦;魏昕;包永强;余华 申请(专利权)人: 东南大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 许方
地址: 210096*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。
搜索关键词: 基于 特征 空间 自适应 投影 语音 情感 识别 方法
【主权项】:
1.一种基于特征空间自适应投影的语音情感识别方法,其特征在于,包括以下步骤:(1)特征提取:对于情感语音库中的每一条语音样本,提取基本的声学特征,对于第个语音样本,;(2)特征选择: (2-1)对于特定说话人的某一个情感特征,此处设为第个特征,分别通过种情感的高斯混合模型,为待识别的情感类别数,得到个高斯混合模型似然概率密度值,以高斯混合模型似然概率密度值映射到0到1之间作为第个样本归属于第个情感类别的隶属度其中,表示第i个样本的特征矢量在第j个情感类别模型参数下的似然值;(2-2)获得特定说话人的第个特征归属于第个情感类别的模糊熵,其计算公式为:其中,常数,那么,对特定说话人的第个特征的平均模糊熵为:其中:为情感类别数;(2-3)对特定说话人的第个特征,当模糊熵超过一定阈值时,则认为此特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征,保留下来的特征组成最终选出的特征矢量,其中阈值的取值范围为0.1~0.5;(3)训练:提取并选择出10维特征矢量以后,对于每一类情感所对应的所有训练数据,采用一个高斯混合模型来建模该类数据集中的数据分布,通过期望最大算法,并且基于情感数据的置信度,通过值控制修正比例对待估计的参数进行修正,,对于情感置信度高的训练样本,在参数迭代估计中的权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型,即,, …… ,,其中为情感类别数;(4)识别:在识别过程中,首先直接计算选出的特征矢量,计算其关于每一类训练好的情感模型, …… ,的似然值,… ,,最终的识别结果为最大的似然值所对应的情感,即:其中,表示第个情感所对应的似然值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210250571.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top