[发明专利]语音情感识别装置有效
申请号: | 201810455164.1 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108682432B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 邓立新;王思羽 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/63;G10L15/05 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 装置 | ||
一种语音情感识别装置,所述装置包括:获取单元,适于获取待处理的语音信号;预处理单元,适于对所获取的语音信号进行预处理,得到预处理后的语音信号;参数提取单元,适于提取预处理后的语音信号的特征参数;所述特征参数包括短时能量及其衍生参数、基音频率及其衍生参数、音质特征共振峰及其衍生参数、对MFCC求取的20阶的Mel倒谱系数和MFCC的一阶差分的最大值、MFCC的一阶差分最小值、MFCC的一阶差分的均值和MFCC的一阶差分的方差;采用所提取的特征参数组成对应的特征矢量序列,得到所述语音信号对应的特征矢量序列;识别单元,适于采用支持向量机对所述语音信号对应的特征矢量序列进行训练和识别,得到对应的语音情感识别结果。上述的方案,可以提高语音情感识别的准确率。
技术领域
本发明涉及语音识别技术领域,具体地涉及一种语音情感识别装置。
背景技术
随着信息技术的高速发展和人类对计算机的依赖性不断的增强,人机交互的能力越来越受到研究者的重视。实际上人机交互中需要解决的问题与人与人交流中的重要因素是一致的,最关键的都是“情感智能”的能力。
目前,关于情感信息处理的研究正在不断地深入中,语音信号中的情感信息处理的研究越来越受到人们的重视。其中的语音情感识别,指利用信号处理技术和模式识别的方法来对语音信号处理和识别,来判断语音属于哪一类情感的技术。
但是,现有的语音情感识别方法,存在着识别准确率低的问题。
发明内容
本发明解决的技术问题是如何提高语音情感识别的准确率。
为解决上述技术问题,本发明实施例提供了一种语音情感识别装置,所述装置包括:
获取单元,适于获取待处理的语音信号;
预处理单元,适于对所获取的语音信号进行预处理,得到预处理后的语音信号;
参数提取单元,适于提取预处理后的语音信号的特征参数;采用所提取的特征参数组成对应的特征矢量序列,得到所述语音信号对应的特征矢量序列;所述特征参数包括短时能量及其衍生参数、基音频率及其衍生参数、音质特征共振峰及其衍生参数、对MFCC求取的20阶的Mel倒谱系数和MFCC的一阶差分的最大值、MFCC的一阶差分最小值、MFCC的一阶差分的均值和MFCC的一阶差分的方差;
识别单元,适于采用支持向量机对所述语音信号对应的特征矢量序列进行训练和识别,得到对应的语音情感识别结果。
可选地,所述预处理单元,适于对所获取的语音信号进行采样与量化、预加重、分帧加窗、短时能量分析和端点检测。
可选地,所述预处理单元,适于对于预处理后得到的多个帧进行遍历,获取遍历到的当前帧;计算遍历到的当前帧及其后连续的预设数量的帧的短时能量;当确定遍历到的当前帧及其后连续的预设数量的帧的短时能量均大于或等于初始无声段语音信号的短时能量时,计算遍历到的当前帧与下一帧之间的短时能量的比值;当确定计算得到的比值大于或等于预设的阈值时,确定遍历到的当前帧为所述语音信号的语音起始帧。
可选地,所述预处理后的语音信号的短时能量及其衍生参数,包括所述预处理后得到的多个帧的短时能量、短时能量的最大值、短时能量的最小值、短时能量的均值、短时能量的方差、短时能量抖动、短时能量的线性回归系数、短时能量的线性回归系数的均方误差和250Hz以下短时能量占全部短时能量的比例。
可选地,所述预处理后的语音信号的基音频率及其衍生参数,包括所述预处理后得到的多个帧的基音频率、基音频率的最大值、基音频率的最小值、基音频率的均值、基音频率的方差、一阶基音频率抖动、二阶基音频率抖动和满足F(i)*F(i+1)!=0的相邻两帧对应的浊音间差分基音;其中,F(i)表示第i帧的基音频率,F(i+1)表示第i+1帧的基音频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810455164.1/2.html,转载请声明来源钻瓜专利网。