[发明专利]基于DIS‑NV特征的情感识别方法在审
申请号: | 201710607464.2 | 申请日: | 2017-07-24 |
公开(公告)号: | CN107316654A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 赵欢;周晓晓;肖宇锋;陈佐 | 申请(专利权)人: | 湖南大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/06;G10L15/14;G10L15/08;G10L15/183 |
代理公司: | 湖南兆弘专利事务所(普通合伙)43008 | 代理人: | 邹大坚,胡君 |
地址: | 410082 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dis nv 特征 情感 识别 方法 | ||
1.一种基于DIS-NV特征的情感识别方法,其特征在于,步骤包括:
S1.DIS-NV特征集构建:选取具有不流利特性的情感词作为DIS特征词、以及具有非语言特性的发声类型作为NV特征类,构建得到DIS-NV特征集;
S2.情感分类模型训练:获取对应各类情感的训练语音文本,将各所述训练语音文本分别与所述DIS-NV特征集进行匹配,根据匹配结果提取得到对应的DIS-NV特征值,并基于双向时序信息采用BLSTM模型进行训练,得到BLSTM分类模型;
S3.情感识别:获取待识别语音文本,将待识别语音文本与所述DIS-NV特征集进行匹配,根据匹配结果提取得到对应的DIS-NV特征值,并使用所述BLSTM分类模型进行识别,输出情感识别结果。
2.根据权利要求1所述的基于DIS-NV特征的情感识别方法,其特征在于,所述DIS-NV特征值的提取步骤为:获取待提取语音文本作为当前语音文本,依次读取当前语音文本中的每个词以及用于标记所述NV特征类的标记词,并分别与所述DIS-NV特征集中各所述DIS特征词、NV特征类进行匹配,若目标词匹配成功,获取目标词当前语音文本中的持续时间,根据获取到的持续时间计算得到目标词的DIS-NV特征值;否则目标词对应的所述DIS-NV特征值为0。
3.根据权利要求2所述的基于DIS-NV特征的情感识别方法,其特征在于:所述进行匹配具体预先构建具有字符串匹配功能的匹配模块,通过调用所述匹配模块进行匹配。
4.根据权利要求2所述的基于DIS-NV特征的情感识别方法,其特征在于:所述根据获取到的持续时间具体按照下式计算得到对应的DIS-NV特征值;
Dd=td/Td;
其中,Dd为目标词d所对应的DIS-NV特征值,td为目标词d对应语音的持续时间,Td为目标词d所在整个句子的持续时间。
5.根据权利要求4所述的基于DIS-NV特征的情感识别方法,其特征在于:所述DIS-NV特征值计算时,具体使用一个包含指定个词的移动窗依次移过待提取语音文本,计算所述目标词d所在的移动窗内所有词的持续时间之和,并作为所述目标词d所在整个句子的持续时间。
6.根据权利要求1~5中任意一项所述的基于DIS-NV特征的情感识别方法,其特征在于,所述步骤S2中得到BLSTM分类模型后还包括模型调整步骤,具体步骤为:使用得到的所述BLSTM情感分类模型计算预测情感值,基于预先确定的模型损失函数将计算得到的所述预测情感值与标准情感值进行比较,根据比较结果调整所述BLSTM情感分类模型,输出最终的BLSTM情感分类模型。
7.根据权利要求6所述的基于DIS-NV特征的情感识别方法,其特征在于:所述BLSTM情感分类模型的模型损失函数具体采用均方误差函数,即通过计算所述预测情感值与标准情感值之间的均方误差,根据误差结果调整所述BLSTM分类模型。
8.根据权利要求1~5中任意一项所述的基于DIS-NV特征的情感识别方法,其特征在于:所述DIS特征词具体包括用于作为插入词且为不带有含义的非语言插入类词、用于作为插入词且带有含义的语言插入类词以及具有重复使用特性的语言重复类词中一种或多种。
9.根据权利要求8所述的基于DIS-NV特征的情感识别方法,其特征在于:所述NV特征类包括呼吸声和/或笑声的发声类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710607464.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于麦克风的音频处理方法和装置
- 下一篇:一种用于航天初始化数据存储的方法