[发明专利]非特定人语音情感识别方法及系统有效
申请号: | 201210321785.3 | 申请日: | 2012-09-03 |
公开(公告)号: | CN102881284A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 毛启容;赵小蕾;詹永照;白李娟;王治锋;杨华宇 | 申请(专利权)人: | 江苏大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 江苏致邦律师事务所 32230 | 代理人: | 樊文红 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特定 人语 情感 识别 方法 系统 | ||
1.一种非特定人语音情感识别方法,其特征在于,所述方法包括:
S1.提取待识别语音信号中用于识别情感副语言的语音特征,输入情感副语言识别模型,得出待识别语音信号所包含的情感副语言,并根据情感副语言与情感类别之间的对应关系,推测出副语言情感识别通道的情感识别结果:待识别语音信号所包含的情感类别以及相应的概率;所述情感副语言包括笑声、伤心的哭声、害怕的哭声、质疑声、急促的喘息声、无奈的叹息声、哀怨的叹息声以及叫喊声;
S2.提取待识别情感语音信号的声学情感特征,输入基于声学情感特征的语音情感识别模型,得出基于声学语音情感特征的情感识别通道的识别结果:待识别语音信号所包含的情感类别以及相应的概率;
S3.对所述基于副语言的情感识别通道和基于声学语音情感特征的情感识别通道的识别结果进行融合,得出待识别情感语音信号所包含的情感状态。
2.据根权利要求1所述的非特定人语音情感识别方法,其特征在于,所述步骤S1之前还包括下列步骤:
S01.建立基于情感副语言的语音情感识别通道,包括:
S011.建立情感语料库,使其中语音信号样本涉及的情感中的每种情感至少有15个语料,每个语料包含至少一种或多种所述情感副语言;所述情感副语言包括笑声、伤心的哭声、害怕的哭声、质疑声、急促的喘息声、无奈的叹息声、哀怨的叹息声以及叫喊声;
S012.对所述语音信号样本进行预处理,包括预加重、加窗处理、分帧、端点检测;
S013.在所述语音信号样本中提取用于识别所述情感副语言的语音特征;
S014.训练情感副语言识别模型;
S015.建立基于情感副语言的情感状态识别模型,基于情感副语言的情感状态识别模型中包括情感副语言识别模型集和情感副语言与情感类别之间的映射关系模型,用于识别情感副语言,以及情感副语言所对应的情感类别和该情感类别的置信度,并得到所述基于副语言的语音情感识别通道的识别结果;所述情感类别包括高兴、悲伤、害怕、惊讶、厌恶、愤怒,所述情感副语言与情感类别之间的映射关系具体为“笑声”对应“高兴”情感类别,“伤心的哭声”对应“悲伤”情感类别,“害怕的哭声”对应“害怕”情感类别,“质疑声”对应“惊讶”情感类别,“急促的喘息声”,对应“害怕”情感类别,“无奈的叹息声”对应“厌恶”情感类别,“哀怨的叹息声”对应“悲伤”情感类别,“叫喊声”对应“愤怒”情感类别;
S02.建立基于声学情感特征的语音情感识别通道,包括:
S021.采用S011所建立的情感语料库;
S022.对所述语音信号样本进行预处理,包括预加重、加窗处理、分帧、端点检测;
S023.对预处理后的语音信号提取声学语音情感特征;
S024.训练基于声学语音情感特征的语音情感识别模型;
S025.建立基于声学语音情感特征的情感状态识别模型,当待识别语音信号经过训练好的基于声学语音情感特征的语音情感识别模型,得到所述基于声学语音情感特征的情感识别通道识别结果;所述情感类别包括高兴、悲伤、害怕、惊讶、厌恶和愤怒。
3.根据权利要求1或2所述的非特定人语音情感识别方法,其特征在于,
所述识别情感副语言所用的语音特征包括:语音的短时能量、过零率、梅尔倒谱系数、基音频率、音质、静音比率、前三个共振峰系数等,以及这些语音特征的最大值、最小值以及变化范围;
所述声学语音情感特征包括,包括短时能量、过零率、梅尔倒谱系数、基音频率、音质、静音比率、前三个共振峰系数,以及所述传统语言语音特征的最大值、最小值以及变化范围。
4.根据权利要求2所述的非特定人语音情感识别方法,其特征在于,
所述步骤S1具体包括:
S11.对待识别语音信号样本进行预处理,包括分帧、加窗和端点检测;
S12.从所述待识别语音信号样本中提取识别情感副语音所用的语音特征,包括提取短时能量、过零率、梅尔倒谱系数、基音频率、音质、静音比率、前三个共振峰系数等,以及这些语音特征的最大值、最小值以及变化范围;
S13.将提取的所述语音特征输入所述基于情感副语言的情感状态识别模型,通过副语言识别模型集识别,得到待识别语音信号样本中包含的情感副语言及其置信度;通过所述情感副语言与情感类别之间的映射关系模型识别,得到待识别语音信号所包含的情感类别及该情感类别的置信度,即得到待识别语音信号在所述的基于情感副语言的语音情感识别通道的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210321785.3/1.html,转载请声明来源钻瓜专利网。