[发明专利]一种基于长短时记忆网络快速识别语音情感类别的方法在审
申请号: | 202110485958.4 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113053418A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 颜思瑞;丁凯星;谢跃;陈允韬;王超 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/03 |
代理公司: | 南京创略知识产权代理事务所(普通合伙) 32358 | 代理人: | 吕娟 |
地址: | 211167 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 短时记忆 网络 快速 识别 语音 情感 类别 方法 | ||
本发明公开了一种基于长短时记忆网络快速识别语音情感类别的方法,包括如下步骤:从原始语音数据样本中提取具有时序信息的帧级语音特征;通过软注意力模型创建基于注意力机制的改进型LSTM模型;用已知的原始语音数据样本及其语音情感类别对改进型LSTM模型进行训练得到情感类别识别模型;对情感类别识别模型进行情感识别测试验证;将未知的原始语音数据样本输入情感类别识别模型进行识别,输出对应的语音情感类别;本发明通过注意力机制优化常规型LSTM模型得到改进型LSTM模型,在保证性能的前提下,有效减少了矩阵计算量,提高语音情感类别识别的性能,具有良好的应用前景。
技术领域
本发明涉及语音情感识别技术领域,特别涉及一种基于长短时记忆网络快速识别语音情感类别的方法。
背景技术
语音是人类表达情感的重要方式之一,以其为媒介的情感识别对智能化的人机交互研究具有重要意义。早前语音情感识别的工作主要聚焦于机器学习算法,如支持向量机,贝叶斯分类器和K近邻算法。而当前随着深度学习的提出,语音情感识别得到了进一步的发展。
虽然早期的工作促进了语音情感的研究,但受传统机器学习只能接受固定长度数据作为输入的影响,目前具有固定维度的静态语音情感特征是使用最多的。例如Schuller提出了一系列的INTERSPEECH情感特征集合,这类特征通过静态统计函数计算了语音特征在时间维度的统计特性,最终可获得一个与语音持续时间无关的固定维度的特征向量。虽然这种特征可以满足传统机器学习只能接受确定维度的数据作为输入的要求,但也导致了统计分析处理后的语音特征丧失了原始语音中的时序信息。为解决上诉问题,我们采用了在计算统计函数之前的帧级语音特征,该特征维度是随语音长度而变化的,且通过帧之间的序列关系保留了原始语音的时序信息。
另一方面,虽然传统机器学习算法因记忆能力较差很难学习时间信息,但随着深度学习算法在情感识别领域中的成功应用,尤其是长短时记忆网络(Long Short-termMemory,LSTM)的提出,为处理语音的时序信息以及变长序列提供了可行性。近些年来,为强化LSTM在特定任务中处理数据的能力,提出了很多LSTM的变体结构。例如:Gers提出了窥视连接,将细胞状态也作为了输入信息。Shi使用卷积操作替换了原始LSTM中部分乘法操作,使得网络能更好的挖掘时空信息。Daniel通过振荡频率稀疏化更新以加快LSTM的收敛速度。上述这些算法在优化LSTM记忆能力的同时也增加了其计算复杂度。
注意力机制最早应用于图像处理领域,并取得了非常好的效果。其核心思想是人脑对整幅图的关注并不是均衡的,是存在一定的区分权重的。在了机器翻译领域,Bahdanau提出了软注意力模型。所谓的“软”是指求取编码后每个单词的概率分布,然后进行加权,即当前待翻译的单词对其他单词的依赖程度(即权重)是有区别的。同样,在LSTM中,可以通过注意力机制为历史细胞状态与候选细胞状态进行加权计算,取代原始的遗忘门与输入控制门。
发明内容
发明目的:本发明公开了一种基于长短时记忆网络快速识别语音情感类别的方法,在常规型LSTM基础上,通过注意力机制优化了常规型LSTM内部的遗忘门和输入控制门的计算方式,提出了基于注意力机制的改进型LSTM模型,在保证性能的前提下,有效减少了矩阵计算量,提高语音情感识别的性能。
技术方案:本发明采用如下技术方案:一种基于长短时记忆网络快速识别语音情感类别的方法,包括以下步骤:
S1、从原始语音数据样本中提取具有时序信息的帧级语音特征;
S2、通过软注意力模型创建基于注意力机制的改进型LSTM模型;
S3、用已知的原始语音数据样本及其语音情感类别对步骤S2中创建好的改进型LSTM模型进行训练,训练好后得到情感类别识别模型;
S4、对步骤S3得到的情感类别识别模型进行情感识别测试验证;
S5、将未知的原始语音数据样本输入情感类别识别模型进行识别,输出对应的语音情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110485958.4/2.html,转载请声明来源钻瓜专利网。