[发明专利]一种端到端的语音情感识别的方法和系统在审

专利信息
申请号: 201910423250.9 申请日: 2019-05-21
公开(公告)号: CN110097894A 公开(公告)日: 2019-08-06
发明(设计)人: 滕炜;倪俊辉;孙佳伟;席晓燕 申请(专利权)人: 焦点科技股份有限公司
主分类号: G10L25/63 分类号: G10L25/63;G10L25/24;G10L25/30;G10L25/03
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210032 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种端到端的语音情感识别的方法和系统,其特征在于,包括语音数据音素特征提取;语音数据倒谱特征提取;音素向量序列和倒谱特征以文件为单位进行对齐,作为输入,利用深度神经网络进行端到端的语音情感识别模型训练;模型部署时,针对任意输入的语音数据的重采样和有效语音段检测。使用上述特征提取流程和识别模型,可以针对语音数据端到端的进行识别,效率更高,预测更精准。
搜索关键词: 语音数据 语音情感 特征提取 模型训练 神经网络 向量序列 音素特征 有效语音 对齐 重采样 音素 检测 预测 部署
【主权项】:
1.一种端到端的语音情感识别的方法,其特征在于,包括如下步骤:步骤一:从IEMOCAP数据集中抽取句子格式的语音数据(下文简称:句子语音数据)和情绪标签,其中句子语音数据是经拆分IEMOCAP数据集中的语音对话为单句语音,每个单句语音为一条语句数据;针对IEMOCAP数据集包含的5个对话,利用5‑fold交叉验证方法处理句子语音数据,即依次选取IEMOCAP数据集的4个对话中的句子语音数据作为训练数据,剩下的1个对话中的句子语音数据作为测试数据,形成数据集;情绪标签选取开心、愤怒、中性、悲伤、沮丧以及激动;其中,IEMOCAO数据集中的原始语音在抽取句子语音数据前,需先经过预处理提取有效语音片段,具体为:步骤101,对接入系统的语音数据进行重采样,统一输入语音的采样频率;重采样的目标频率设置为16khz,多声道数据转单声道的过程始终提取左声道语音数据;步骤102,对重采样后的语音数据进行有效语音段提取,过滤掉静音或噪声部分,具体包括:切分语音数据,借助开源工具webrtcvad判断每一帧是噪音帧还是有效帧;有效帧输出1,噪音帧输出0,将语音数据帧序列转换成0‑1序列;通过设置一个滑动窗口(buf),来寻找有效语音段的起止点,当buf中的1状态达到整个buf的90%,就认为找到有效语音段的起点。,当buf中的0状态达到整个buf长度的90%,就认为找到有效语音段的结束点;步骤二:句子语音数据的音素特征提取:使用pocketsphinx工具处理每条句子语音数据形成音素序列,经词嵌入模型训练得到音素嵌入模型,通过音素嵌入模型将音素序列转换成音素向量序列;统计音素向量序列长度,根据统计结果的集中范围,统一所有的音素向量序列长度;步骤三:句子语音数据的对数梅尔倒谱特征提取:对句子语音数据做加窗分帧的预处理,然后经快速傅里叶变换和梅尔滤波处理获得句子语音数据在时频域上的梅尔倒谱图,对倒谱图求一阶差分值和二阶差分值,进而获得包含语音静态特征和动态特征的倒谱特征图;统计数据集中所有音频文件的帧数,根据帧数的集中范围,确定后续训练模型中池化层的边长参数;步骤四:基于深度神经网络构建语音情绪识别模型,融合句子语音数据的音素特征和倒谱特征:采用双向长短记忆模型对句子语音数据对应的音素向量序列进行训练,提取音素向量序列中反映情绪的语调变化信息,以及音素向量序列对应的文本序列中所包含的反映情绪的语义信息;使用卷积神经网络模型对倒谱特征图进行特征提取;根据步骤二中统计的音素向量序列长度,确定双向长短记忆模型的时间步长,将两个模型输出的特征向量分别输入attention层,将得到的特征进行首尾连接,输入全连接层进行特征拟合;步骤五:使用softmax函数:对步骤四的输出进行归一化处理,得到语音数据在每种情绪类别的概率;对于长语音,这个结果就是一个情绪标签的列表,列表中的元素分别对应着按时间排序的有效语音段的情绪预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910423250.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top