[发明专利]一种基于无监督域适应的语音情感识别方法有效
申请号: | 201610600762.4 | 申请日: | 2016-07-27 |
公开(公告)号: | CN106469560B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 毛启容;薛文韬;高利剑;N.鲁瓦;申自强;詹永照 | 申请(专利权)人: | 江苏大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L17/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于无监督域适应的语音情感识别方法,提出的模型包括:特征提取,情感标签预测,域标签预测。特征提取:首先将原始输入数据分解成两块特征,情感判别特征和情感无关特征,然后将情感判别特征进行层次非线性转换得到高层情感特征。将高层情感特征用于情感标签和域标签的预测。利用梯度下降法对整个模型的参数进行更新,得到特征提取层的各层权重。然后,进行特征提取,源域有标签样本通过训练好的特征提取层得到高层情感特征。最后,进行分类器SVM的训练,将源域有标签样本的高层情感特征和相对应的情感标签输入到SVM中训练,训练好的SVM可用于目标域测试样本的分类。解决了语音情感识别中训练样本和测试样本数据分布不同的问题。 | ||
搜索关键词: | 一种 基于 监督 适应 语音 情感 识别 方法 | ||
【主权项】:
1.一种基于无监督域适应的语音情感识别方法,其特征在于,包括如下步骤:/nS1,语音样本预处理:利用开源工具包openEAR从原始语音样本中提取384维特征,替代原始语音样本作为输入数据;/nS2,模型训练:所述模型包括三部分:特征提取,情感标签预测,域标签预测;源域的有标签样本和目标域的无标签训练样本通过S1得到相应的384维特征作为模型的输入数据;具体实现包括如下:/n在模型的特征提取层,输入数据通过不同的权重映射成两种特征:情感判别特征和情感无关特征;然后情感判别特征通过层次非线性转换得到高层情感特征;/n源域有标签样本的高层情感特征用于情感标签的预测,源域和目标域样本的高层情感特征用于域标签的预测;/n最后更新模型的参数,将两个标签预测器的损失进行反向传播,用梯度下降法进行参数的更新;/nS3,特征提取:利用S2中训练好的特征提取层的参数,将源域有标签训练样本的384维特征转换成高层情感特征;/nS4,分类器训练:利用S3中源域有标签训练样本的高层情感特征和相对应的情感标签,进行分类器SVM的训练;/nS5,语音情感识别:对任意一个目标域的语音测试样本,首先利用步骤S1提取384维特征作为输入数据,然后通过S2中训练好的特征提取层得到高层情感特征,最后输入到S4训练好的SVM中进行分类。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610600762.4/,转载请声明来源钻瓜专利网。
- 上一篇:语音数据的调整方法及装置
- 下一篇:磁盘用玻璃基板的制造方法