[发明专利]一种深度信念网络的语音情感识别方法及系统在审
申请号: | 201910173690.3 | 申请日: | 2019-02-28 |
公开(公告)号: | CN109785863A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 巩微;黄玮;伏文龙;黄晨晨;范文庆 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/27;G10L25/03;G10L17/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音情感 信念网络 语音信号特征 预处理语音 多分类器 预处理 支持向量机 信号采用 语音信号 识别率 无监督 分类 | ||
1.一种深度信念网络的语音情感识别方法,其特征在于,所述识别方法包括:
获取语音信号;
预处理所述语音信号,获得预处理语音信号;
对所述预处理语音信号采用深度信念网络进行无监督的语音信号特征提取,获得语音信号特征;
将所述语音信号特征采用支持向量机进行语音情感的识别分类,获得语音情感识别结果。
2.根据权利要求1所述的一种深度信念网络的语音情感识别方法,其特征在于,所述对所述预处理语音信号采用深度信念网络进行无监督的语音信号特征提取,获得语音信号特征具体包括:
将低层至高层的N层限制玻尔兹曼机堆叠,获得深度信念网络;
根据所述预处理语音信号对第i层的限制玻尔兹曼机进行无监督训练,获得第i最优参数,所述第i最优参数为所述第i层的限制玻尔兹曼机的最优参数;其中,i的取值依次为1,2,......,N;
根据所述第i最优参数和所述预处理语音信号对第i+1层的限制玻尔兹曼机进行无监督训练,获得第i+1最优参数;
将所述多个最优参数利用全局训练的方法微调至所述深度信念网络收敛至全局最优,获得多个微调最优参数;
根据所述微调最优参数提取所述预处理语音信号的语音信号特征。
3.根据权利要求1所述的一种深度信念网络的语音情感识别方法,其特征在于,所述将所述语音信号特征采用支持向量机进行语音情感的识别分类,获得语音情感识别结果具体包括:
采用核函数将所述语音信号特征的样本点映射到高维特征空间,获得空间线性可分的样本;
所述支持向量机根据所述空间线性可分的样本对所述语音信号特征进行逻辑判断,获得语音情感识别结果。
4.一种深度信念网络的语音情感识别系统,其特征在于,所述识别系统包括:
语音信号获取模块,用于获取语音信号;
语音信号预处理模块,用于预处理所述语音信号,获得预处理语音信号;
特征提取模块,用于对所述预处理语音信号采用深度信念网络进行无监督的语音信号特征提取,获得语音信号特征;
情感识别模块,用于将所述语音信号特征采用支持向量机进行语音情感的识别分类,获得语音情感识别结果。
5.根据权利要求4所述的一种深度信念网络的语音情感识别系统,其特征在于,所述特征提取模块具体包括:
深度信念网络建立单元,用于将低层至高层的N层限制玻尔兹曼机堆叠,获得深度信念网络;
监督训练单元,用于根据所述预处理语音信号对第i层的限制玻尔兹曼机进行无监督训练,获得第i最优参数,所述第i最优参数为所述第i层的限制玻尔兹曼机的最优参数;其中,i的取值依次为1,2,......,N;根据所述第i最优参数和所述预处理语音信号对第i+1层的限制玻尔兹曼机进行无监督训练,获得第i+1最优参数;
参数微调单元,用于将所述多个最优参数利用全局训练的方法微调至所述深度信念网络收敛至全局最优,获得多个微调最优参数;
语音信号特征提取单元,用于根据所述微调最优参数提取所述预处理语音信号的语音信号特征。
6.根据权利要求4所述的一种深度信念网络的语音情感识别系统,其特征在于,所述情感识别模块具体包括:
核函数单元,用于采用核函数将所述语音信号特征的样本点映射到高维特征空间,获得空间线性可分的样本;
逻辑判断单元,用于所述支持向量机根据所述空间线性可分的样本对所述语音信号特征进行逻辑判断,获得语音情感识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910173690.3/1.html,转载请声明来源钻瓜专利网。