[发明专利]一种基于语音信号的梯度提升决策树抑郁程度识别系统有效

专利信息
申请号: 202010490441.X 申请日: 2020-06-02
公开(公告)号: CN112006697B 公开(公告)日: 2022-11-01
发明(设计)人: 刘蔚;黄永明 申请(专利权)人: 东南大学
主分类号: A61B5/16 分类号: A61B5/16;G10L25/03;G10L25/09;G10L25/24;G10L25/66
代理公司: 南京众联专利代理有限公司 32206 代理人: 杜静静
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语音 信号 梯度 提升 决策树 抑郁 程度 识别 系统
【权利要求书】:

1.一种基于语音信号的梯度提升决策树抑郁程度识别系统,其特征在于,该系统用于实现基于语音信号的梯度提升决策树抑郁程度识别方法,所述方法包括如下步骤:

步骤S1、从抑郁数据集中获取语音信号样本以及对应样本标签的PHQ-8值,PHQ-8是抑郁症筛查量表,将语音样本与标签一一对应,并抽取一部分样本集合作为测试样本集,另一部分作为训练集;

步骤S2、对语音信号进行语音预处理,保证后续语音处理得到的信号均匀、平滑,提高语音处理质量;所述步骤S2对语音信号进行语音预处理的具体步骤为:

S2.1:对语音信号离散化,使用一阶高通滤波器进行预加重,一阶高通滤波器的z变换表达式如下:

H(z)=1-αz-1,0.9α1.0,

其中α为预加重系数,z为z变换中离散系统的复变量,具有实部和虚部,H(z)表示该一阶高通滤波器的z变换函数;

S2.2:对信号进行分帧,帧长为30ms,帧移为10ms;

S2.3:选择汉明窗函数,其计算公式如下:

其中ω(n)为窗函数,R为窗口大小,n表示语音采样的第n个采样点;

步骤S3、在经过处理后的语音数据中提取表征抑郁和情感的韵律学特征、基于谱的相关特征和音质特征;所述步骤S3提取表征抑郁的语音特征具体步骤为:

S3.1:基频特征提取,基音周期Pitch是声带振动频率的倒数,提取基音频率,基音周期是声带开启和闭合一次说用的时长,基音频率是其倒数,当信号序列为x(n)时,对其进行快速傅里叶变换FFT得到其离散频域X(ω)

X(ω)=FFT[x(n)]

则序列

称为倒频谱,简称为倒谱,这里FFT和FFT-1分别为快速傅里叶变换和快速傅里叶反变换,的实际单位是时间s;

语音x(n)是由声门脉冲激励u(n)经声道响应v(n)滤波而得,即

x(n)=u(n)*v(n)

则这三个量的倒谱有

在倒频谱中,声门脉冲激励和声道响应是相对分离的,因此从中可以分离恢复出声门脉冲激励,从而得到基音周期;

S3.2:提取短时能量,短时能量是指一帧语音的能量,设语音信号为x(n)、加窗函数ω(n)分帧处理后的第i帧语音信号为yi(n),则yi(n)满足:

yi(n)=ω(n)*x((i-1)*inc+n),1≤n≤C,1≤i≤f

ω(n)为窗函数;yi(n)是一帧的数值;inc为帧移长度;fn为分帧后的总帧数,则第i帧的语音信号的短时能量为,其中C表示进行语音信号的长度

S3.3:提取短时平均过零率,它表示一帧语音中信号的波形穿过零电平的次数,对于离散信号来说,相邻数据改变一次符号就算做一次过零,设语音信号为x(n),分帧后第i帧语音信号为yi(n),短时平均过零率为

S3.4:提取Mel频率倒谱系数MFCC,MFCC系数模拟了人耳听觉系统感知信号的能力,提取过程具体如下:

1)音频信号经过预加重、分帧、分窗得到预处理后的语音信号x(n)

2)对预处理后的信号进行离散傅里叶变换DFT得到离散谱X(k),变换公式为:

其中N表示进行变换的离散序列长度

3)将DFT变换后的语音信息输入到Mel滤波器组Hm(k),取对数后得到对数频谱

4)将S(m)经过离散余弦变换DCT得到倒频谱域,得到MFCC为

步骤S4、基于梯度决策提升树的机器学习方法预测对训练集进行学习,并利用最后训练得到的模型测试语音信号,输出其对应的PHQ-8值作为抑郁程度的依据;步骤S4基于梯度决策提升树的机器学习方法为:

假设训练集样本T={(x1,y1),(x2,y2),…,(xm,ym)},最大迭代次数为T,损失函数L,输出是强学习器f(x),c表示回归树叶子的最佳拟合值,m表示样本数量;

S4.1:初始化决策提升树,c的均值为所有样本PHQ-8的均值;

选取均方差作为损失函数

L(y,f(x))=(y-f(x))2

S4.2:对于迭代次数t=1,2,3,…,T,有:对于样本i=1,2,3,…,m,计算负梯度rti

利用(xi,rti)i=1,2,3,…,m拟合出一颗CART回归树,得到第t棵回归树,其对应的叶子节点区域为Rtj,j=1,2,3,…,J,其中J为树t的叶子节点数,对于叶子区域j=1,2,3,…,J,计算最佳的拟合值

更新决策树

S4.3:得到最终决策树f(x)的表达式,输出PHQ-8值

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010490441.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top