[发明专利]一种基于高阶谱语音特征的抑郁症分类方法有效
申请号: | 202111362261.4 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114219005B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 程忱;苗潇琳;李瑶;王春燕;黄晓妍;董昊;杜子尧;张屿佳 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 高阶谱 语音 特征 抑郁症 分类 方法 | ||
1.一种基于高阶谱语音特征的抑郁症分类方法,其特征在于,包括以下步骤:
步骤S1:语音数据文件预处理,并对预处理后的语音数据文件进行样本裁剪,得到语音样本文件;
步骤S2:计算语音样本文件三阶积累函数的二级傅里叶变换,得到高阶谱语音特征的双谱;然后将双谱进行归一化计算,得到高阶谱语音特征的双相干;
步骤S3:根据双谱,获取5个双谱特征,并得到每个双谱特征对应的对数谱图;
步骤S4:根据双相干,获取5个双相干特征,并得到每个双相干特征对应的对数谱图;
步骤S5:构建三维二分卷积神经网络,采用三维二分卷积神经网络算法,选择双谱特征的对数谱图、双相干特征的对数谱图作为分类特征,构建分类器,然后采用自适应优化方法对分类器进行检验,具体包括:
S51:将M*M维度的对数谱图输入到三维二分卷积神经网络中,其中M表示对数谱图的大小;
S52:三维二分卷积神经网络的第一层表示三维二分卷积神经网络的卷积层,其滤波器的大小为M0*M0*3,覆盖频率空间M0和3个卷积核,M0具体表示如下:
其中,M0表示M第一次二分法向上取整的值;
S53:三维二分卷积神经网络的第二层表示三维二分卷积神经网络的最大池化层,它沿着时间轴移动窗口内核,并保存最大值以表示整个窗口,从而减少其输入维度的数量;移动的步长为S=1,使用填充P=0来保持输入层的极端,输出矩阵的大小N1如下:
N1=(M-M0+2P)/S+1
S54:三维二分卷积神经网络的第三层表示三维二分卷积神经网络的二层卷积,将步骤S53输出的结果作为本步骤的输入,其滤波器的大小为M1*M1*3,M1公式具体表示如下:
其中,M1表示N1第一次二分法向上取整的值;
S55:三维二分卷积神经网络的第四层表示三维二分卷积神经网络的最大池化层,将N1作为输入进行最大池化层,输出结果矩阵,输出矩阵的大小N2:
N2=(N1-M1+2P)/S+1
S56:三维二分卷积神经网络的第五层表示三维二分卷积神经网络的全连接层,最大池输出被平坦化,并用作两个输入层和一个输出层的全连接神经网络的输入。
2.根据权利要求1所述的一种基于高阶谱语音特征的抑郁症分类方法,其特征在于,在步骤S1中,语音数据文件预处理,具体包括:移除语音数据文件中计算机生成的虚拟语音,以及移除语音数据文件中的静默部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111362261.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:纳米囊泡的多重表型分析
- 下一篇:一种输电线路智能融合目标检测方法