[发明专利]基于特征空间自适应投影的语音情感识别方法有效
申请号: | 201210250571.1 | 申请日: | 2012-07-19 |
公开(公告)号: | CN102779510A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 赵力;黄程韦;魏昕;包永强;余华 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 空间 自适应 投影 语音 情感 识别 方法 | ||
1.一种基于特征空间自适应投影的语音情感识别方法,其特征在于,包括以下步骤:
(1)特征提取:对于情感语音库中的每一条语音样本,提取基本的声学特征,对于第 个语音样本,;
(2)特征选择:
(2-1)对于特定说话人的某一个情感特征,此处设为第个特征,分别通过种情感的高斯混合模型,为待识别的情感类别数,得到个高斯混合模型似然概率密度值,以高斯混合模型似然概率密度值映射到0到1之间作为第个样本归属于第个情感类别的隶属度:
其中,表示第i个样本的特征矢量在第j个情感类别模型参数下的似然值;
(2-2)获得特定说话人的第个特征归属于第个情感类别的模糊熵,其计算公式为:
其中,常数取,那么,对特定说话人的第个特征的平均模糊熵为:
其中:为情感类别数;
(2-3)对特定说话人的第个特征,当模糊熵超过一定阈值时,则认为此特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征,保留下来的特征组成最终选出的特征矢量,其中阈值的取值范围为0.1~0.5;
(3)训练:提取并选择出10维特征矢量以后,对于每一类情感所对应的所有训练数据,采用一个高斯混合模型来建模该类数据集中的数据分布,通过期望最大算法,并且基于情感数据的置信度,通过值控制修正比例对待估计的参数进行修正,,对于情感置信度高的训练样本,在参数迭代估计中的权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型,即,, …… , ,其中为情感类别数;
(4)识别:在识别过程中,首先直接计算选出的特征矢量,计算其关于每一类训练好的情感模型, …… , 的似然值,… ,,最终的识别结果为最大的似然值所对应的情感,即:
其中, 表示第个情感所对应的似然值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210250571.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带开盒拉手的包装盒
- 下一篇:包装机械用板块抓取翻转装置