[发明专利]一种基于谱图特征的并行卷积循环神经网络的语音情感识别方法在审
申请号: | 201910901182.2 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110534132A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 姜芃旭;雷沛之;傅洪亮 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/30;G10L25/63 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于谱图特征的并行卷积循环神经网络的语音情感识别方法。包括以下步骤:首先,从每条语音中提取帧级特征,并利用长短期记忆网络逐帧进行高级特征提取。同时,计算帧级特征的一阶差分以及二阶差分,并将其组合成三维特征,通过卷积神经网络来对这些三维特征进行高级特征提取。然后将两个高级特征融合并进行批归一化处理。最后,使用SoftMax分类器对情感进行分类。本发明的基于谱图特征的并行卷积循环神经网的语音情感识别方法,模块内部采用并行的连接结构来同时处理谱图特征,能够有效的提升语音情感识别的性能。 | ||
搜索关键词: | 高级特征 语音情感 并行卷积 三维特征 帧级 卷积神经网络 循环神经网络 归一化处理 记忆网络 连接结构 分类器 神经网 二阶 一阶 逐帧 并行 语音 分类 融合 | ||
【主权项】:
1.本发明公布了一种基于谱图特征的并行卷积循环神经网络的语音情感识别方法,其特征在于:包括以下步骤,/n步骤(A)对原始语音数据预处理;/n步骤(B)提取语音中的帧级特征;/n步骤(C)利用并行卷积循环神经网络(PCRN)来提取高级特征并进行特征融合;/n步骤(D)对融合特征进行批归一化(BN)处理;/n步骤(E)利用softmax分类器对情感进行分类。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910901182.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种音频播放方法及系统
- 下一篇:一种语音情感识别系统及语音情感识别方法