[发明专利]一种贝叶斯优化的RF与LightGBM疾病预测方法有效

专利信息
申请号: 202210708716.1 申请日: 2022-06-21
公开(公告)号: CN115050477B 公开(公告)日: 2023-06-20
发明(设计)人: 李培峦;李沛谕;刘珂妍;彭雪晴;张雨祺 申请(专利权)人: 河南科技大学
主分类号: G16H50/50 分类号: G16H50/50;G06F18/2413;G06F18/2415;G06F18/241;G06F18/214;G06F18/21;G06N20/00
代理公司: 洛阳公信知识产权事务所(普通合伙) 41120 代理人: 宋晨炜
地址: 471000 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 贝叶斯 优化 rf lightgbm 疾病 预测 方法
【说明书】:

发明提供一种贝叶斯优化的RF与LightGBM疾病预测方法,该方法首先用最大互信息系数进行特征选择、用SMOTE进行预处理,然后用贝叶斯优化算法选择随机森林和LightGBM学习器的最优超参数,之后用所选的最优超参数分别代入随机森林与LightGBM算法训练模型,最后分别在训练集上进行10折交叉验证、在测试集进行模型预测性能评估。在提高模型的性能和泛化能力的同时,提高了数据的有效性和准确率,避免网格搜索针对非凸问题易得到局部最优以及参数过多耗时长的问题,降低了模型的训练误差,缩短了训练时间。

技术领域

本发明涉及疾病预测技术领域,具体涉及一种贝叶斯优化的RF与LightGBM疾病预测方法。

背景技术

生物医学领域是人工智能的重要应用领域,随着人类微生物组计划、人肠道宏基因组学计划的相继开展,研究表明,肠道微生物具有调节宿主免疫、代谢、内分泌和神经等生物学功能,正常微生态失调可以导致多种疾病的发生,利用肠道微生物数据构建疾病预测模型是研究热点之一。高通量测序技术产生的大量复杂且高维的微生物组数据,为研究微生物菌群与人体之间的相互关系提供了新的契机,但同时也使传统的统计学方法难以满足这些数据分析的需求。

从理论方面讲,传统的统计方法已经不适用于高通量测序技术产生的大量复杂、高维且稀疏的微生物组数据分析,近年来,机器学习在微生物组数据分析领域已经得到广泛应用并取得一定成果,包括利用贝叶斯网络、随机森林等算法对直肠癌进行预测,利用K近邻算法建立了2型糖尿病的预测模型等。但目前国内外学者利用机器学习算法与深度学习算法构建的疾病预测模型在预测性能方面仍有改进空间。

从现实方面讲,虽然关于人类微生物组的数据有很多,但是将这些数据转换为生物学和临床上有意义的原理仍然是一个重大挑战。因此,探索适用于微生物组数据分析的机器学习算法可以为疾病的诊断进行辅助分析,提高模型性能,对于疾病的临床检测,诊断和治疗具有十分重要的现实意义。

发明内容

有鉴于此,本发明提供一种贝叶斯优化的RF与LightGBM疾病预测方法,利用贝叶斯优化算法与随机森林和LightGBM相结合,在提高了模型的性能和泛化能力同时,能够准确地对疾病预测进行风险侦测。

为了达到上述目的,本发明所采用的技术方案是:一种贝叶斯优化的RF与LightGBM疾病预测方法,包括以下步骤:

S1、获取包含多个带有标签值的原始样本的原始数据集,构造微生物相对丰度矩阵,采用最大互信息系数进行特征选择,对数据集进行过滤并划分数据集,将数据集分为训练数据集和测试数据集;

S2、利用SMOTE方法对训练数据集进行过采样处理,获得平衡的数据集;

S3、用贝叶斯优化算法选择随机森林和LightGBM学习器的最优超参数;

S4、用所选的最优超参数分别代入随机森林与LightGBM算法训练模型;

S5、分别在训练集上进行10折交叉验证、在测试集进行模型预测性能评估。

进一步的,所述步骤S1中的特征选择包括以下步骤:

S11、对于随机变量X和Y所构成的二维散点图构建网格尺度r×c划分;

S12、计算所划分的各个网格里的互信息公式:

将最大的互信息值按照下列公式进行归一化处理:

S13、用多种不同的划分方式中最大的归一化互信息值做为最大互信息系数:

MIC(X;y)=maxr×c<f(n)N(X;Y)      (3)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210708716.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top