[发明专利]一种基于语音信号的梯度提升决策树抑郁程度识别系统有效

申请号：	202010490441.X	申请日：	2020-06-02
公开（公告）号：	CN112006697B	公开（公告）日：	2022-11-01
发明（设计）人：	刘蔚;黄永明	申请（专利权）人：	东南大学
主分类号：	A61B5/16	分类号：	A61B5/16;G10L25/03;G10L25/09;G10L25/24;G10L25/66
代理公司：	南京众联专利代理有限公司 32206	代理人：	杜静静
地址：	210096 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音信号梯度提升决策树抑郁程度识别系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语音信号的梯度提升决策树抑郁程度识别系统，其特征在于，该系统用于实现基于语音信号的梯度提升决策树抑郁程度识别方法，所述方法包括如下步骤：

步骤S1、从抑郁数据集中获取语音信号样本以及对应样本标签的PHQ-8值，PHQ-8是抑郁症筛查量表，将语音样本与标签一一对应，并抽取一部分样本集合作为测试样本集，另一部分作为训练集；

步骤S2、对语音信号进行语音预处理，保证后续语音处理得到的信号均匀、平滑，提高语音处理质量；所述步骤S2对语音信号进行语音预处理的具体步骤为：

S2.1：对语音信号离散化，使用一阶高通滤波器进行预加重，一阶高通滤波器的z变换表达式如下：

H(z)＝1-αz^-1,0.9α1.0，

其中α为预加重系数，z为z变换中离散系统的复变量，具有实部和虚部，H(z)表示该一阶高通滤波器的z变换函数；

S2.2：对信号进行分帧，帧长为30ms，帧移为10ms；

S2.3：选择汉明窗函数，其计算公式如下：

其中ω(n)为窗函数，R为窗口大小,n表示语音采样的第n个采样点；

步骤S3、在经过处理后的语音数据中提取表征抑郁和情感的韵律学特征、基于谱的相关特征和音质特征；所述步骤S3提取表征抑郁的语音特征具体步骤为：

S3.1:基频特征提取，基音周期Pitch是声带振动频率的倒数,提取基音频率，基音周期是声带开启和闭合一次说用的时长，基音频率是其倒数，当信号序列为x(n)时，对其进行快速傅里叶变换FFT得到其离散频域X(ω)

X(ω)＝FFT[x(n)]

则序列

称为倒频谱，简称为倒谱，这里FFT和FFT^-1分别为快速傅里叶变换和快速傅里叶反变换，的实际单位是时间s；

语音x(n)是由声门脉冲激励u(n)经声道响应v(n)滤波而得，即

x(n)＝u(n)*v(n)

则这三个量的倒谱有

在倒频谱中，声门脉冲激励和声道响应是相对分离的，因此从中可以分离恢复出声门脉冲激励，从而得到基音周期；

S3.2:提取短时能量，短时能量是指一帧语音的能量，设语音信号为x(n)、加窗函数ω(n)分帧处理后的第i帧语音信号为y_i(n),则y_i(n)满足：

y_i(n)＝ω(n)*x((i-1)*inc+n)，1≤n≤C，1≤i≤f

ω(n)为窗函数；y_i(n)是一帧的数值；inc为帧移长度；fn为分帧后的总帧数，则第i帧的语音信号的短时能量为,其中C表示进行语音信号的长度

S3.3:提取短时平均过零率，它表示一帧语音中信号的波形穿过零电平的次数，对于离散信号来说，相邻数据改变一次符号就算做一次过零，设语音信号为x(n)，分帧后第i帧语音信号为y_i(n),短时平均过零率为

S3.4:提取Mel频率倒谱系数MFCC，MFCC系数模拟了人耳听觉系统感知信号的能力，提取过程具体如下：

1)音频信号经过预加重、分帧、分窗得到预处理后的语音信号x(n)

2)对预处理后的信号进行离散傅里叶变换DFT得到离散谱X(k)，变换公式为：

其中N表示进行变换的离散序列长度

3)将DFT变换后的语音信息输入到Mel滤波器组H_m(k)，取对数后得到对数频谱

4)将S(m)经过离散余弦变换DCT得到倒频谱域，得到MFCC为

；

步骤S4、基于梯度决策提升树的机器学习方法预测对训练集进行学习，并利用最后训练得到的模型测试语音信号，输出其对应的PHQ-8值作为抑郁程度的依据；步骤S4基于梯度决策提升树的机器学习方法为：

假设训练集样本T＝{(x₁,y₁),(x₂,y₂),…,(x_m,y_m)},最大迭代次数为T，损失函数L，输出是强学习器f(x),c表示回归树叶子的最佳拟合值，m表示样本数量；

S4.1:初始化决策提升树，c的均值为所有样本PHQ-8的均值；

选取均方差作为损失函数

L(y,f(x))＝(y-f(x))²

S4.2:对于迭代次数t＝1,2,3,…,T,有：对于样本i＝1,2,3,…,m,计算负梯度r_ti；

利用(x_i,r_ti)i＝1,2,3,…,m拟合出一颗CART回归树，得到第t棵回归树，其对应的叶子节点区域为R_tj,j＝1,2,3,…,J,其中J为树t的叶子节点数，对于叶子区域j＝1,2,3,…,J,计算最佳的拟合值

更新决策树

S4.3:得到最终决策树f(x)的表达式，输出PHQ-8值

。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010490441.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

A 农业

A61 医学或兽医学；卫生学
A61B 诊断；外科；鉴定
A61B5-00 用于诊断目的的测量
A61B5-01 .测量一些身体部位的温度
A61B5-02 .测量脉搏、心率、血压或血流；综合的脉搏/心率/血压的测定；其他不是用于测定心血管状况的，如使用本小组技术与心电图术结合的；测量血压的心导管
A61B5-03 .测量体内除血压以外的流体压力，例如脑压
A61B5-04 .测量人体或人体各部分的生物电信号
A61B5-05 .用电流或磁场的诊断测量

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语音信号的梯度提升决策树抑郁程度识别系统有效

专利文献下载