[发明专利]一种基于语音信号的梯度提升决策树抑郁程度识别系统有效
申请号: | 202010490441.X | 申请日: | 2020-06-02 |
公开(公告)号: | CN112006697B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 刘蔚;黄永明 | 申请(专利权)人: | 东南大学 |
主分类号: | A61B5/16 | 分类号: | A61B5/16;G10L25/03;G10L25/09;G10L25/24;G10L25/66 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 信号 梯度 提升 决策树 抑郁 程度 识别 系统 | ||
1.一种基于语音信号的梯度提升决策树抑郁程度识别系统,其特征在于,该系统用于实现基于语音信号的梯度提升决策树抑郁程度识别方法,所述方法包括如下步骤:
步骤S1、从抑郁数据集中获取语音信号样本以及对应样本标签的PHQ-8值,PHQ-8是抑郁症筛查量表,将语音样本与标签一一对应,并抽取一部分样本集合作为测试样本集,另一部分作为训练集;
步骤S2、对语音信号进行语音预处理,保证后续语音处理得到的信号均匀、平滑,提高语音处理质量;所述步骤S2对语音信号进行语音预处理的具体步骤为:
S2.1:对语音信号离散化,使用一阶高通滤波器进行预加重,一阶高通滤波器的z变换表达式如下:
H(z)=1-αz-1,0.9α1.0,
其中α为预加重系数,z为z变换中离散系统的复变量,具有实部和虚部,H(z)表示该一阶高通滤波器的z变换函数;
S2.2:对信号进行分帧,帧长为30ms,帧移为10ms;
S2.3:选择汉明窗函数,其计算公式如下:
其中ω(n)为窗函数,R为窗口大小,n表示语音采样的第n个采样点;
步骤S3、在经过处理后的语音数据中提取表征抑郁和情感的韵律学特征、基于谱的相关特征和音质特征;所述步骤S3提取表征抑郁的语音特征具体步骤为:
S3.1:基频特征提取,基音周期Pitch是声带振动频率的倒数,提取基音频率,基音周期是声带开启和闭合一次说用的时长,基音频率是其倒数,当信号序列为x(n)时,对其进行快速傅里叶变换FFT得到其离散频域X(ω)
X(ω)=FFT[x(n)]
则序列
称为倒频谱,简称为倒谱,这里FFT和FFT-1分别为快速傅里叶变换和快速傅里叶反变换,的实际单位是时间s;
语音x(n)是由声门脉冲激励u(n)经声道响应v(n)滤波而得,即
x(n)=u(n)*v(n)
则这三个量的倒谱有
在倒频谱中,声门脉冲激励和声道响应是相对分离的,因此从中可以分离恢复出声门脉冲激励,从而得到基音周期;
S3.2:提取短时能量,短时能量是指一帧语音的能量,设语音信号为x(n)、加窗函数ω(n)分帧处理后的第i帧语音信号为yi(n),则yi(n)满足:
yi(n)=ω(n)*x((i-1)*inc+n),1≤n≤C,1≤i≤f
ω(n)为窗函数;yi(n)是一帧的数值;inc为帧移长度;fn为分帧后的总帧数,则第i帧的语音信号的短时能量为,其中C表示进行语音信号的长度
S3.3:提取短时平均过零率,它表示一帧语音中信号的波形穿过零电平的次数,对于离散信号来说,相邻数据改变一次符号就算做一次过零,设语音信号为x(n),分帧后第i帧语音信号为yi(n),短时平均过零率为
S3.4:提取Mel频率倒谱系数MFCC,MFCC系数模拟了人耳听觉系统感知信号的能力,提取过程具体如下:
1)音频信号经过预加重、分帧、分窗得到预处理后的语音信号x(n)
2)对预处理后的信号进行离散傅里叶变换DFT得到离散谱X(k),变换公式为:
其中N表示进行变换的离散序列长度
3)将DFT变换后的语音信息输入到Mel滤波器组Hm(k),取对数后得到对数频谱
4)将S(m)经过离散余弦变换DCT得到倒频谱域,得到MFCC为
;
步骤S4、基于梯度决策提升树的机器学习方法预测对训练集进行学习,并利用最后训练得到的模型测试语音信号,输出其对应的PHQ-8值作为抑郁程度的依据;步骤S4基于梯度决策提升树的机器学习方法为:
假设训练集样本T={(x1,y1),(x2,y2),…,(xm,ym)},最大迭代次数为T,损失函数L,输出是强学习器f(x),c表示回归树叶子的最佳拟合值,m表示样本数量;
S4.1:初始化决策提升树,c的均值为所有样本PHQ-8的均值;
选取均方差作为损失函数
L(y,f(x))=(y-f(x))2
S4.2:对于迭代次数t=1,2,3,…,T,有:对于样本i=1,2,3,…,m,计算负梯度rti;
利用(xi,rti)i=1,2,3,…,m拟合出一颗CART回归树,得到第t棵回归树,其对应的叶子节点区域为Rtj,j=1,2,3,…,J,其中J为树t的叶子节点数,对于叶子区域j=1,2,3,…,J,计算最佳的拟合值
更新决策树
S4.3:得到最终决策树f(x)的表达式,输出PHQ-8值
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010490441.X/1.html,转载请声明来源钻瓜专利网。