[发明专利]一种基于混合熵下采样和集成分类器的语音情感识别系统在审
申请号: | 202310509029.1 | 申请日: | 2023-05-08 |
公开(公告)号: | CN116524960A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 李冬冬;王喆;宣正吉;王建伟 | 申请(专利权)人: | 华东理工大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/06;G06F18/21;G06F18/214 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 采样 集成 分类 语音 情感 识别 系统 | ||
1.一种基于混合熵下采样和集成分类器的语音情感识别系统,其特征在于,包括如下步骤:
1)把数据集划分为训练数据和测试数据两部分,将训练数据的语音信号划分为片段后提取语谱图,用其训练基分类器并从中获得每个语音片段的深度特征和置信度;
2)计算所有语音片段的混合熵并将其与置信度的加权和作为排名值;
3)排名值大于设定阈值的语音片段的语谱图用于重新训练一个基分类器,并再次计算全部语音片段的排名值和训练基分类器,此操作循环给定轮次,每轮次训练的基分类器组成集成分类器;
4)测试语音分段并提取语谱图后输入集成分类器计算该条语音的情感识别结果。
2.根据权利要求1所述的一种基于混合熵下采样和集成分类器的语音情感识别系统,其特征在于,步骤2)中的混合熵由情感确定度熵和结构分布熵组成,其中情感确定度熵用于衡量语音片段表达情感的显著程度;
情感确定度熵的公式为:
其中,i为训练数据上语音片段的编号,C为数据集中情感类别数,k为所设定的近邻数,为第i个语音片段的基础确定度熵,ln表示计算以e为底的对数,其公式如下:
具体而言,情感确定度熵的公式中,表示在训练数据的深度特征上与第i个语音片段计算欧式距离最近的k个语音片段中,片段数目最多的情感类别标签对应的片段数,其公式如下:
其中,表示在训练数据中与第i个语音片段计算深度特征间欧式距离最近的k个语音片段中的情感类别标签为j的片段数目。
3.根据权利要求2所述的混合熵,其特征在于,混合熵中的结构分布熵用于衡量语音片段在深度特征空间中的分布结构稳定性;
结构分布熵的公式为:
其中,i为训练数据上语音片段的编号,k为所设定的近邻数,di,q表示在训练数据中第i个语音片段与第q个语音片段深度特征间的欧氏距离,ln表示计算以e为底的对数。
4.根据权利要求1所述的一种基于混合熵下采样和集成分类器的语音情感识别系统,其特征在于,步骤2)中每个语音片段的混合熵由权利要求2中的情感确定度熵和权利要求3中的结构分布熵计算;
混合熵的公式为:
其中,i为训练数据上语音片段的编号,表示情感确定度熵,表示结构分布熵,nor是Min-Max归一化函数,MIEi表示第i个语音片段的混合熵。
5.根据权利要求1所述的一种基于混合熵下采样和集成分类器的语音情感识别系统,其特征在于,步骤2)中各个语音片段的排名值定义为权利要求4中所述的混合熵和权利要求1中步骤1)获得的置信度的加权和;
排名值的公式为:
Ranki=(1-λ)nor(confi)+λnor(-MTEi)
其中,i为训练数据上语音片段的编号,confi表示第i个语音片段的置信度,MIEi表示第i个语音片段的混合熵,λ是权重系数,nor是Min-Max归一化函数,Ranki表示第i个语音片段的排名值,排名值作为对语音片段进行下采样的依据。
6.根据权利要求1所述的一种基于混合熵下采样和集成分类器的语音情感识别系统,其特征在于,步骤3)中所获得的集成分类器为M={ml|l=1,2,3,…,L},其中ml表示第l轮次所训练的基分类器,L为所设定的总训练轮次,测试过程中一条完整的语音被划分为E个语音片段,每个语音片段在第l轮次训练所得的基分类器上的输出为其中e为片段编号,C为数据集中情感类别数,那么该条完整语音在集成分类器M上的输出可以定义为:
其中,e为片段编号,每个语音片段在第l轮次训练所得的基分类器上的输出为E为该条完整语音所划分的语音片段数目,L为所设定的总训练轮次,则该条完整语音在权利要求1所述的一种基于混合熵下采样和集成分类器的语音情感识别系统的最终识别情感下标Rind的计算公式为:
其中,C为数据集中情感类别数,则Rind所对应的情感类别为系统最终的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310509029.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息技术服务用展示装置及其使用方法
- 下一篇:电磁杠杆式机构释放装置