[发明专利]基于特征空间自适应投影的语音情感识别方法有效

专利信息
申请号: 201210250571.1 申请日: 2012-07-19
公开(公告)号: CN102779510A 公开(公告)日: 2012-11-14
发明(设计)人: 赵力;黄程韦;魏昕;包永强;余华 申请(专利权)人: 东南大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 许方
地址: 210096*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特征 空间 自适应 投影 语音 情感 识别 方法
【说明书】:

技术领域

发明涉及一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。

背景技术

语音作为最自然的交流手段之一,在人机交互应用中得到了越来越广泛的应用。语音中的情感信息,与语义信息不同,通常是在说话人无意识的控制下表达的。语音情感的表达不容易伪装和控制,因而为计算机理解用户的意图提供了一个有效的新途径。情感的表达方式与很多因素有关,如年龄、性别、语境和文化背景等。因此语音情感识别比起其它的模式识别问题有特殊的困难。对语音中的情感进行建模是语音情感识别中的最基本也是最重要的问题。随着语音情感识别研究的深入,研究者们提出了很多颇具前景的实际应用。如,在车载电子中,通过对驾驶员的情感状态(如愉快、惊讶、愤怒和悲伤等)进行跟踪,监测与识别,从而做出相应的响应以保证驾驶的安全。又例如,通过对恐惧类别的极端情感的识别,在一个基于音频的监控系统中,可以对可能发生的危险情感进行探测。

由于语音中的特征众多,当提取出特征之后,需要面临的一个重要问题是如何在如此众多的特征中选择情感区分度最大的特征。特别是每个特定的说话人与一般模型之间都存在着差异,而语音情感识别中是与说话人无关的,因此如何来保留特定说话人与一般模型之间共同的特征,压缩特定说话人与一般模型之间差异大的特征,从而达到说话人自适应,对于语音情感识别来说十分重要。而目前,还未出现合适的技术来对特征进行有效地选择,从而降低特定说话人对整体语音情感识别的影响。

发明内容

本发明为解决现有技术的缺陷,提出了一种基于特征空间自适应投影的语音情感识别方法。

本发明为解决其技术问题采用如下技术方案:

一种基于特征空间自适应投影的语音情感识别方法,包括以下步骤:

(1)特征提取:对于情感语音库中的每一条语音样本,提取基本的声学特征,对于第                                                个语音样本,;

(2)特征选择: 

(2-1)对于特定说话人的某一个情感特征,此处设为第个特征,分别通过种情感的高斯混合模型,为待识别的情感类别数,得到个高斯混合模型似然概率密度值,以高斯混合模型似然概率密度值映射到0到1之间作为第个样本归属于第个情感类别的隶属度:

其中,表示第i个样本的特征矢量在第j个情感类别模型参数下的似然值;

(2-2)获得特定说话人的第个特征归属于第个情感类别的模糊熵,其计算公式为:

      

其中,常数取,那么,对特定说话人的第个特征的平均模糊熵为:

     其中:为情感类别数;

(2-3)对特定说话人的第个特征,当模糊熵超过一定阈值时,则认为此特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征,保留下来的特征组成最终选出的特征矢量,其中阈值的取值范围为0.1~0.5;

(3)训练:提取并选择出10维特征矢量以后,对于每一类情感所对应的所有训练数据,采用一个高斯混合模型来建模该类数据集中的数据分布,通过期望最大算法,并且基于情感数据的置信度,通过值控制修正比例对待估计的参数进行修正,,对于情感置信度高的训练样本,在参数迭代估计中的权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型,即,, …… , ,其中为情感类别数;

(4)识别:在识别过程中,首先直接计算选出的特征矢量,计算其关于每一类训练好的情感模型, …… , 的似然值,… ,,最终的识别结果为最大的似然值所对应的情感,即:

其中,表示第个情感所对应的似然值。  

本发明的有益效果如下:

本方法对高维空间的后验概率进行了特征空间的投影压缩,保留了特定说话人与一般模型之间共同的特征,压缩了特定说话人与一般模型之间差异大的特征,从而达到说话人自适应的识别效果,选出的特征具有很好的情感区分度。

附图说明

图1为本发明的方法流程图。

图2为本方法的识别结果示意图。

具体实施方式

下面结合附图对本发明创造做进一步详细说明。

图1为本发明的方法流程图,本发明的方法共分为四步。

(1)特征提取

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210250571.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top