[发明专利]一种基于机器学习的抑郁症评级系统及方法在审
申请号: | 202210334156.8 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114649075A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李晓虹;孙源鸿;刘启健;李毅;李康 | 申请(专利权)人: | 首都医科大学附属北京安定医院 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H20/70;G16H50/30;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 廖曦 |
地址: | 100088 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 抑郁症 评级 系统 方法 | ||
1.一种基于机器学习的抑郁症评级系统,其特征在于:该系统包括数据采集模块、数据预处理模块、特征选择模块、机器学习模块和执行模块;
数据采集模块,从全球可访问的在线调查中获取数据,包括DASS-42问卷所有项目的答案、填写者的人口学统计变量和填写问卷所花费的时间信息;
数据预处理模块,除开年龄和性别数据,根据答题者的分数分为高抑郁或低抑郁两个级别;对数据采集模块中筛除后得到的数据的特征进行组织处理,组织处理的内容包括将所有可分类的列转换为代表每个类别的one-hot编码;检查每个标签的行数之后,通过上采样来平衡数据集;将特征和标签分开,并将数据集划分为训练数据集、测试数据集和保留数据集;
特征选择模块,对预处理得到的数据,选用最小冗余最大相关法(Max-Relevance andMin-Redundancy,MRMR),根据数据集中每对变量的成对相关性或互信息选择最相关的特征,同时最小化变量之间的冗余,判断检查量表中哪些问题对预测抑郁风险的权重更大;
机器学习模块,从特征选择中确定的题目进行不同组合来预测低抑郁和高抑郁水平;评估模型性能,获得基于若干问题的模型,以确定需要多少问题才能在保留数据集上实现90%的受试者工作特征曲线(Receiver Operating Characteristic,ROC)的曲线下面积(Area Under Curve,AUC);机器学习训练仅在训练数据集上完成,并在测试数据集上进行内部验证;在获得一个模型后,重新组合训练和测试数据集,并以相同的方式再次分割,训练和测试另一个模型;总共进行100次数据重组、分区、训练和测试;优化超参数以获得最佳模型:根据原始验证数据集评估的AUC ROC分数和F1分数选择性能最佳的模型,即AUC和F1值最高的模型;通过网格搜索获得每个模型的最佳超参数,即AUC和F1值最高的参数:使用不同的超参数值组合来训练每次迭代以确定哪些组合是最佳的;最后选择最佳模型来评估抑郁等级;
执行模块,保留获得的最佳模型,建立网站应用程序原型并执行模型,检验模型对于来自未用于训练和测试的个体数据进行分类时的准确性,即衡量对真实用户进行评估时的模型性能。
2.根据权利要求1所述的一种基于机器学习的抑郁症评级系统,其特征在于:所述特征选择包括无监督技术MRMR和有监督的特征选择方法;
所述无监督技术MRMR为:根据数据集中每对变量的成对相关性或互信息选择最相关的特征,同时最小化变量之间的冗余;
所述有监督的特征选择方法为:在对最重要的特征进行排序之前,为所有特征和标签拟合一个极端随机树分类器(ExtraTreesClassifier,ETC);极端随机树分类器在数据集的子样本上拟合几个极端随机树并对结果进行平均;特征重要性是通过计算该特征带来的标准的归一化总减少量获得的,称为基尼重要性(Gini Importance,GI),将每个特征的重要性计算为包含该特征的所有决策树的分割数之和,与它分割的样本数成正比;
所述最重要的特征是通过对特征重要性进行排名来获得的;最后结合MRMR和随机决策树分类器的结果选出原量表最重要的问题,即对预测抑郁水平高低的权重更大的问题。
3.根据权利要求1所述的一种基于机器学习的抑郁症评级系统,其特征在于:所述测试的方法包括逻辑回归LR、高斯朴素贝叶斯GNB、支持向量机SVM、随机森林RF、多层感知器神经网络MLP、极端梯度提升决策树XGBoost和堆叠泛化集成Ensemble。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京安定医院,未经首都医科大学附属北京安定医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210334156.8/1.html,转载请声明来源钻瓜专利网。