[发明专利]一种基于无监督域适应的语音情感识别方法有效

申请号：	201610600762.4	申请日：	2016-07-27
公开（公告）号：	CN106469560B	公开（公告）日：	2020-01-24
发明（设计）人：	毛启容;薛文韬;高利剑;N.鲁瓦;申自强;詹永照	申请（专利权）人：	江苏大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L17/02
代理公司：	暂无信息	代理人：	暂无信息
地址：	212013 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于无监督域适应的语音情感识别方法，提出的模型包括：特征提取，情感标签预测，域标签预测。特征提取：首先将原始输入数据分解成两块特征，情感判别特征和情感无关特征，然后将情感判别特征进行层次非线性转换得到高层情感特征。将高层情感特征用于情感标签和域标签的预测。利用梯度下降法对整个模型的参数进行更新，得到特征提取层的各层权重。然后，进行特征提取，源域有标签样本通过训练好的特征提取层得到高层情感特征。最后，进行分类器SVM的训练，将源域有标签样本的高层情感特征和相对应的情感标签输入到SVM中训练，训练好的SVM可用于目标域测试样本的分类。解决了语音情感识别中训练样本和测试样本数据分布不同的问题。
搜索关键词：	一种基于监督适应语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于无监督域适应的语音情感识别方法，其特征在于，包括如下步骤：/nS1，语音样本预处理：利用开源工具包openEAR从原始语音样本中提取384维特征，替代原始语音样本作为输入数据；/nS2，模型训练：所述模型包括三部分：特征提取，情感标签预测，域标签预测；源域的有标签样本和目标域的无标签训练样本通过S1得到相应的384维特征作为模型的输入数据；具体实现包括如下：/n在模型的特征提取层，输入数据通过不同的权重映射成两种特征：情感判别特征和情感无关特征；然后情感判别特征通过层次非线性转换得到高层情感特征；/n源域有标签样本的高层情感特征用于情感标签的预测，源域和目标域样本的高层情感特征用于域标签的预测；/n最后更新模型的参数，将两个标签预测器的损失进行反向传播，用梯度下降法进行参数的更新；/nS3，特征提取：利用S2中训练好的特征提取层的参数，将源域有标签训练样本的384维特征转换成高层情感特征；/nS4，分类器训练：利用S3中源域有标签训练样本的高层情感特征和相对应的情感标签，进行分类器SVM的训练；/nS5，语音情感识别：对任意一个目标域的语音测试样本，首先利用步骤S1提取384维特征作为输入数据，然后通过S2中训练好的特征提取层得到高层情感特征，最后输入到S4训练好的SVM中进行分类。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏大学，未经江苏大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610600762.4/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于无监督域适应的语音情感识别方法有效

专利文献下载