[发明专利]一种基于机器学习算法的阿尔茨海默病预测方法在审
申请号: | 202210225506.7 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114724712A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 陈思恩;吴炎泉 | 申请(专利权)人: | 科技谷(厦门)信息技术有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06K9/62;G06N5/00;G06N20/00 |
代理公司: | 厦门致群财富专利代理事务所(普通合伙) 35224 | 代理人: | 刘兆庆;邓贵琴 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 算法 阿尔茨海默病 预测 方法 | ||
1.一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,具体包括如下步骤:
S1、获取样本数据,对各研究变量进行等级化编码及赋值;
S2、通过随机采样建立包含多个决策树的随机森林预测模型;
S3、将预设值输入随机森林预测模型;
S4、根据随机森林预测模型的输出结果,预测阿尔茨海默病的诱因。
2.如权利要求1所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于:步骤S1中所述研究变量包括烟龄、饮酒史、体育锻炼、蔬菜水果食用。
3.如权利要求1所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,步骤S2的具体过程如下:
S21、对样本数据进行T次的随机采样,并依据分类树分类规则生成T个训练集,每个训练集包含m个训练集样本;
S22、在m个训练集样本中,对决策树训练样本基于抽样聚合方法进行采样,得到若干自主训练集,并依据自主训练集构建Cart决策树作为弱分类器;
S23、随机选择决策树分类特征,生成足够数量的决策树弱分类器;
S24、确定决策树分类节点数量mtry和决策树数量ntree;
S25、运用已经构建完成的各决策树弱分类器对新的特征向量进行分类,并依据分类结果基于bagging算法合成强分类器,再基于强分类器的分类结果,完成对特征向量的预测与判别;
S26、基于随机森林分类中各特征属性的OOB误差,对各特征属性对AD影响程度进行评估。
4.如权利要求3所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,步骤S23的具体过程如下:
S231、在已选取的m个训练集样本中,选取样本的n个属性变量,作为决策树分类标准;
S232、判别n个属性特征各自的GINI指数,再将GINI指数最大的特征属性作为决策树的分类节点,并采取固定浅层模式避免剪枝过程,建立决策树弱分类器;
S233、重复步骤S231和S232,直至生成足够数量的决策树弱分类器。
5.如权利要求4所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,步骤S232建立决策树弱分类器的具体过程为:样本中的每个属性都要遍历所有可能的分割方法,得到一个最小的ginsplit,该分割就作为此节点处的分裂标准,再按分割对应的属性值来进行分裂,并根据不同的属性值创建树枝;进一步向下划分,事先确定一个叶节点纯度阈值,大于或等于该阈值时则停止划分。
6.如权利要求3所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,步骤S24的具体过程如下:控制ntree取值保持恒定,逐步对mtry进行调节,依此判定mtry的最佳值;控制各mtry保持恒定,逐步对ntree进行条件,当模型泛化误差较小且趋于稳定时则认为ntree为最佳。
7.如权利要求3所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于,步骤S24中决策树分类节点数量mtry为4,决策树数量ntree为80。
8.如权利要求1所述的一种基于机器学习算法的阿尔茨海默病预测方法,其特征在于:步骤S1中样本数据选自年龄在65岁及以上的老年人,性别不限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技谷(厦门)信息技术有限公司,未经科技谷(厦门)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210225506.7/1.html,转载请声明来源钻瓜专利网。