[发明专利]基于似然概率模糊熵的紧张状态下语音情绪自动识别方法在审
申请号: | 201610024270.5 | 申请日: | 2016-01-14 |
公开(公告)号: | CN105719664A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 周锋;孙冬生;王如刚;周六英 | 申请(专利权)人: | 盐城工学院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/27;G10L15/01;G10L15/02;G10L15/18 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 陈静 |
地址: | 224051*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 概率 模糊 紧张状态 语音 情绪 自动识别 方法 | ||
1.一种基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,包括如下步骤:
(1)建立语音数据库,所述语音数据库包括紧张、喜悦和平静的语音数据;
(2)从语音数据库中提取语音情感特征,所述语音情感特征包括韵律情感特征和音质情感特征;
(3)采用fisher准则对语音情感特征进行特征评价,选择识别特征;
(4)依据识别特征利用似然概率模糊熵判断待识别样本的情感类别,并在模糊熵超过阈值时拒判。
2.根据权利要求1所述的基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,所述步骤(1)具体包括如下子步骤:
(1-1)被试对象分别录制紧张、喜悦和平静的语音片段;
(1-2)筛选出紧张、喜悦和平静的语音数据。
3.根据权利要求1所述的基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,步骤(2)中所述的韵律情感特征包括:短时能量的均值、最大值、最小值、中值、方差;短时能量差分的均值、最大值、最小值、中值、方差;基音的均值、最大值、最小值、中值、方差;基音一阶差分的均值、最大值、最小值、中值、方差;基音二阶差分的均值、最大值、最小值、中值、方差;基音范围;发音帧数、不发音帧数、不发音帧数和发音帧数之比、发音帧数和总帧数之比、发音区域数、不发音区域数、发音区域数和不发音区域数之比、发音区域数和总区域数之比、最长发音区域数、最长不发音区域数。
4.根据权利要求1所述的基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,步骤(2)中所述的音质情感特征包括:第一共振峰的均值、最大值、最小值、中值、方差;第二共振峰的均值、最大值、最小值、中值、方差;第三共振峰的均值、最大值、最小值、中值、方差;第一共振峰一阶差分的均值、最大值、最小值、中值、方差;第二共振峰一阶差分的均值、最大值、最小值、中值、方差;第三共振峰一阶差分的均值、最大值、最小值、中值、方差;250Hz以下谱能量百分比、650Hz以下谱能量百分比、4kHz以上谱能量百分比;谐波噪声比(HNR)的均值、最大值、最小值、中值、方差。
5.根据权利要求1所述的基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,步骤(3)中所述的fisher准则对第d个维度具体表示为
其中μ为语音情感特征的特征值的均值,σ为语音情感特征的特征值的标准差,m为语音情感特征的类别的总数。
6.根据权利要求1所述的基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,其特征在于,所述步骤(4)具体包括如下子步骤:
(4-1)采用GMM对紧张、喜悦和平静三种情感进行建模,每种情感对应一个GMM模型,得到每种情感的p(xi|λj),通过最大后验概率准则判决;xi表示第i条语句样本,λj表示情感类别,最大后验概率可以表示为:
待识别的样本判决为:
其中,j*表示样本所属的类别;
(4-2)分别用紧张、喜悦和平静的GMM似然概率密度值代表待识别样本与紧张、喜悦和平静情感类别的符合程度;当模糊熵超过阈值Th时则发生拒判:
其中,C为情感类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城工学院,未经盐城工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024270.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有无线LAN功能的录音重放装置
- 下一篇:一种语音识别的方法及系统