[发明专利]一种结合局部与全局信息的语音情感特征提取方法在审
申请号: | 201310460191.5 | 申请日: | 2013-09-30 |
公开(公告)号: | CN103531206A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 文贵华;孙亚新 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/03 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 局部 全局 信息 语音 情感 特征 提取 方法 | ||
技术领域
本发明涉及一种语音信号处理和模式识别技术,特别涉及一种结合局部与全局信息的语音情感特征提取方法。
背景技术
随着信息技术的不断发展,社会发展对情感计算提出了更高的要求。例如在人机交互方面,一个拥有情感能力的计算机能够对人类情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并能有效减轻人们使用电脑的挫败感,甚至能帮助人们理解自己和他人的情感世界。例如采用此类技术探测驾驶司机的精力是否集中,感受到的压力水平等,并做出相对反应。此外,情感计算还能应用在机器人、智能玩具、游戏、电子商务等相关产业中,以构筑更加拟人化的风格和更加逼真的场景。情感也反映了人类的心理健康情况,情感计算的应用可以有效地帮助人们避免不良情绪,保持乐观健康的心理。
人的面部表情,语音,生理指标等都能在一定程度上反映人类的情感。本发明涉及基于语音的情感识别中的语音特征抽取问题。目前使用在语音情感识别中的特征有很多,广泛使用的是MFCC特征。但是MFCC忽略了Mel滤波器内部的能量分布信息以及每一帧不同滤波器结果之间的局部分布信息,对噪音敏感,为此本发明提出一种同时考虑这两类信息的语音情感特征提取方法。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种结合局部与全局信息的语音情感特征提取方法,该方法简单,易于实现。
本发明的目的通过下述技术方案实现:一种结合局部与全局信息的语音情感特征提取方法,包括以下步骤:
[1]将语音信号分帧;
[2]对每一帧进行傅立叶变换;
[3]使用Mel滤波器对傅立叶变换结果滤波,并对滤波结果取对数;
[4]对取得的对数结果使用局部Hu运算,获得第1类特征,称为HuLFPC特征;
[5]对局部Hu运算后的每一帧进行离散余弦变换,获得第2类特征,称为HuMFCC特征;
[6]对第[3]步计算的对数结果进行差分运算,然后对差分运算结果的每一帧进行离散余弦变换,获得第3类特征,称为DMFCC特征。
所述的步骤[4],对步骤[3]计算的对数结果使用局部Hu运算,获得第1类特征,称为HuLFPC特征。
所述的步骤[5],对局部Hu运算后的每一帧进行离散余弦变换,获得第2类特征,称为HuMFCC特征。
所述的步骤[6],对步骤[3]计算的对数结果在一个窗口内进行差分运算,然后对差分运算结果的每一帧进行离散余弦变换,获得第3类特征,称为DMFCC特征。
本发明提取以下三类特征:
第1类特征:用于提取每个Mel滤波器内部的能量分布信息,称为HuLFPC特征,其首先将语音信号分帧,并对每一帧进行傅立叶变换;然后对傅立叶变换结果使用Mel滤波器滤波,对滤波结果求能量,并对能量取对数;再对取得的对数结果在局部窗口内求Hu矩,获得HuLFPC特征。
第2类特征:用于提取每个Mel滤波器内部的能量分布信息,称为HuMFCC特征,其方法是获得HuLFPC特征之后,对每一帧的HuLFPC特征系数进行一维DCT变换,获得HuMFCC特征。
第3类特征:用于提取每一帧不同滤波器结果之间的局部分布信息,称为DMFCC特征,其方法,首先将语音信号分帧,并对每一帧进行傅立叶变换;然后对傅立叶变换结果使用Mel滤波器滤波,对滤波结果求能量,并对能量取对数;再对取对数结果在局部窗口内求差分;最后对每一帧的差分系数进行一维DCT变换,获得DMFCC特征。
本发明的工作原理:语音情感不同时,发音清晰度、基音变化程度、发音强度、语速都会发生相应的变化,这些变化将改变语谱图能量的集中程度,如发音比较清晰、发音强度高时语谱图能量比较集中。而Hu的一阶矩恰好能够评价数据能量集中到数据重心的程度,这样能够很好的提取语音情感变化时导致语谱图上能量集中度发生的变化。另外目前大部分研究都只将导数应用到语谱图的时间轴上,以此提取能量发生变化的程度,但是情感发生变化时会改变语音信号的频率分布,从而在语谱图的频率轴上发生变化,所以本文使用频率轴上的导数来提取这些变化。
本发明相对于现有技术具有如下的优点及效果:
1、方法简单,整个特征提取框架简单,易于实现。
2、算法复杂度低,所有特征提取方法中没有计算复杂度高的公式。
3、HuLFPC具有局部旋转、平移不变性,能够突出共振峰、清音的整体能量分布信息,并且能够部分克服各种噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310460191.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于忆阻器的浮地忆容器和忆感器模拟器
- 下一篇:送料装置及其使用方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置