[发明专利]基于特征选择和优化的语音情感识别方法在审
申请号: | 201811525935.6 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109493886A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 陈建春;李欢欢;王金鹏;吴琴;乜亮 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/24;G10L25/30;G10L25/45 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音情感 特征参数 卷积神经网络 特征选择 原始语音 准确率 语音 预处理 提取预处理 端点检测 技术识别 情感识别 情感特征 情感语音 人机交互 手机通讯 算法选择 随机森林 刑事侦查 医学诊断 预加重 分帧 加窗 算法 优化 数据库 应用 分析 | ||
1.一种基于特征选择和优化的语音情感识别方法,其特征在于,包括如下:
(1)从casia汉语情感语料库中选择愤怒、恐惧、高兴和悲伤这四种原始语音,形成语音数据库,这四种原始语音分别对应四个类别标签;
(2)对原始语音依次进行预加重、加窗分帧和端点检测的预处理,得到预处理后的语音信号x(n);
(3)提取预处理后语音信号x(n)的基音频率F,短时能量E,短时平均过零率Z,第一共振峰频率F1、第二共振峰频率F2和梅尔频率倒谱系数C,得到语音情感的六种特征参数;
(4)提取到语音的六种情感特征参数后,用随机森林模型评估各个特征参数的重要性,删除不重要的特征参数,得到最优的情感特征参数:
(4a)设置随机森林模型参数:包括决策树的棵数N、每棵树随机抽取的样本数n和特征个数m,特征选择的最低特征维度M,并用基尼指数确定决策树节点的阈值,将语音情感除梅尔频率倒谱系数C外的的五种特征参数作为随机森林算法的输入,对随机森林模型进行训练,得到训练好的随机森林模型;
(4b)定义随机森林训练未抽取到的数据为袋外数据,用训练好的随机森林模型对袋外数据进行分类,计算分类错误的数目W与袋外数据总数O之比,得到袋外数据误差e1,对袋外数据的特征X加入随机噪声,再用随机森林模型对袋外数据进行分类,得到加噪的袋外数据误差e2;
(4c)用e2与e1之差对语音情感五种特征参数的重要性VI进行评估,再将特征参数按特征重要性VI降序排序,确定删除比例q并删除重要性低的特征参数,得到一个新的特征参数组合;
(4d)用新的特征参数组合建立并训练新的随机森林模型,重复上述(4b)-(4c),直到剩余M个特征参数;
(4e)根据(4c)中得到的每个特征组合和它们建立的随机森林模型,比较对应的袋外数据误差e1,将袋外数据误差最低的特征组合作为最后选定的最优语音情感特征参数;
(5)根据最优语音情感特征参数,通过卷积神经网络得出语音的情感识别结果:
(5a)对卷积神经网络初始化,即先对该网络结构初始化,再对网络的参数初始化;
(5b)卷积神经网络初始化完成后,将最优语音情感特征参数及对应语音的类别标签作为卷积神经网络的输入,训练得到最优的卷积神经网络模型;
(5c)将袋外最优语音情感特征参数作为最优的卷积神经网络模型的输入,该模型的输出为语音的类别标签,即得到最终的语音情感识别结果。
2.根据权利要求1所述的方法,其特征在于:(5a)中对卷积神经网络结构初始化,其实现如下:
设置输入层大小为40×46;
设第一层为卷积层C1,共有20个大小为5×7的卷积核,在每个卷积层后面均加入批归一化BN层和ReLu激活函数层;
设第四层为池化层S1,该池化层特征映射均采用2×2的最大池化操作;
设第五层为卷积层C2,共有40个大小为5×5的卷积核;
设第八层为池化层S2;
设第九层为卷积层C3,共有60个大小为4×3的卷积核;
设第十二层为池化层S3;
设第十三层为卷积层C4,共有80个大小为2×3的卷积核;
设第十六层为Dropout层,随机剔除每层神经元个数的概率p为0.5;
设第十七层为全联接层FC,包含4个大小为1×1的卷积核,最后一层为softmax分类器,得到初始化后的卷积神经网络结构。
3.根据权利要求1所述的方法,其特征在于:(5a)中对卷积神经网络参数初始化,其实现如下:
使用随机梯度下降法SGD,设置每次迭代的批量块大小为120,最大迭代次数为200,学习率η为:
其中,i为当前的迭代次数,200为最大迭代次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811525935.6/1.html,转载请声明来源钻瓜专利网。