[发明专利]基于注意力机制和卷积神经网络的语音抑郁症识别系统有效
申请号: | 201811343483.X | 申请日: | 2018-11-13 |
公开(公告)号: | CN109599129B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 戴国骏;商吉利;沈方瑶;胡焰焰;张桦 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/45;G10L25/30;G10L25/18;G10L15/02;G10L15/04;G10L15/14 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 卷积 神经网络 语音 抑郁症 识别 系统 | ||
本发明涉及一种基于注意力机制和卷积神经网络的语音抑郁症识别系统。本发明首先对语音数据进行预处理,对较长的语音数据进行分割,依据的是分割后的片段能够充分包含抑郁症相关的特征。然后对分割后每个片段提取梅尔频谱图,调整其输入到神经网络模型的频谱图尺寸大小,以便模型的训练。之后用预训练好的Alexnet深度卷积神经网络进行权值的微调,提取梅尔频谱图中更高级的语音特征。然后用注意力机制算法,对片段级语音特征进行权重调整,得到句级的语音特征。最后对句级语音特征用SVM分类模型进行抑郁症的分类。本系统考虑了和抑郁症相关的语音特征的提取,提供一种基于语音的抑郁症识别的新系统。
技术领域
本发明涉及语音处理,机器学习和深度学习领域,尤其是涉及基于注意力机制和卷积神经网络的语音抑郁症识别方法。
背景技术
抑郁症是一种最常见的情绪障碍,往往表现出情绪低落,态度消极,自我责备等负面状态。抑郁症不仅会对自身造成伤害,对日常生活,社会工作,人际关系等产生很大的影响。但现阶段,抑郁症的诊断还是依靠医生的主观判断为主,一些评价量表为辅助手段,因此抑郁症很难被准确诊断,使得抑郁症患者难以得到基本的治疗。如何让计算机通过语音信号自动分析和判别说话人的抑郁症的严重程度,即语音的抑郁症识别,成为了研究热点。能够找到客观准确、简便高效、非侵入、低廉的自动检测抑郁症的方法对抑郁症的就诊率和治愈率有很大的提高作用,对医学领域也有重要的贡献。
目前,对语音的抑郁症识别的研究主要是从语音信号中提取与抑郁症相关基础的低级特征(LLDs),比如基频(F0)、共振峰、梅尔频谱系数(MFCC)等。然后用分类器对这些提取的特征进行分类,分类器包括支持向量机(SVM),随机森林(RF),高斯混合模型(GMM)等。但存在的问题是上述特征提取过程提取的是低级手动提取的语音特征,没有提取语音信号中更深层次的特征,因此并不能充分表示语音数据。随着深度学习的发展,卷积神经网络在图像特征提取中体现出了优异的性能。有研究者在语音抑郁症识别方面也尝试去用卷积神经网络来自动提取语音中和抑郁症相关的更深层次特征,取得了一定的研究进展。
这些方法都通过分割语音,得到语音片段,然后将语音频谱图输入到神经网络中,自动提取与抑郁症相关的深层次特征,最后进行决策分类。但是,存在的问题是,并不是所以的语音片段都包含与抑郁症相关的特征,比如静音段,沉默段。这些语音片段并没有与抑郁症相关的特征,但是训练时,将分类标签和整句的标签设为一样,都是抑郁症标签,这使得分类的准确率大大的降低。
注意力机制(attention mechanism)在机器翻译,图像字幕匹配等方面表现出显著的性能。注意力模型能够使神经网络关注最相关的信息,比如在语音特征中,使和神经网络关注和抑郁症最相关的信息,忽略不相关的特征,这很好的解决了不相关的特征在训练神经网络过程中的影响。目前,在语音的抑郁症识别领域,还未见采用注意力机制和卷积神经网络结合来识别抑郁症的方法。本发明就是利用注意力机制和卷积神经网络实现语音的抑郁症识别。
发明内容
本发明的目的就是为了解决上述现有语音的抑郁症识别技术的不足,提供一种基于注意力机制和卷积神经网络的语音抑郁症识别方法,用于实现根据语音来自动检测抑郁症,提高抑郁症识别的准确率。
本发明解决上述技术问题所采用的技术方案为:
一种基于注意力机制和卷积神经网络的语音抑郁症识别方法,通过语音数据的预处理、提取语音频谱图、构建深度卷积神经网络(DCNN)预训练模型得到片段级特征、用注意力机制算法得到句级特征、SVM模型分类输出结果;
该方法包含的具体步骤如下:
步骤1、语音数据的预处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811343483.X/2.html,转载请声明来源钻瓜专利网。