[发明专利]一种基于飞蛾扑火优化算法的XGBoost乳腺癌快速诊断方法在审
申请号: | 202110018388.8 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112801140A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 胡雪梅;徐蔚鸿;陈沅涛 | 申请(专利权)人: | 长沙理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00;G16H50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410114 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 飞蛾扑火 优化 算法 xgboost 乳腺癌 快速 诊断 方法 | ||
本发明涉及乳腺癌诊断领域,尤其涉及一种基于飞蛾扑火优化算法的XGBoost乳腺癌诊断方法,所述方法包括:获取原始乳腺癌数据集并对数据集进行归一化处理;采用默认参数XGBoost特征选择筛选特征,降低数据维度并将降维后的乳腺癌样本数据集划分为训练样本集和测试样本集;采用飞蛾扑火优化算法优化XGBoost模型的参数;将训练样本集输入优化后的XGBoost模型中进行模型训练,采用10折交叉验证验证模型性能并利用准确率Accuracy指标度量训练好的模型;输入测试样本集到训练好的模型中,获取分类结果,并采用Accuracy、F1、G‑mean和AUC指标度量分类结果。与现有技术相比,本发明模型简单,具有可解释性、预测准确率较高和预测速度快等优点。
技术领域
本发明涉及乳腺癌诊断领域,尤其涉及一种基于飞蛾扑火优化算法的XGBoost乳腺癌快速诊断方 法。
背景技术
在全球范围内,乳腺癌约占影响女性的所有癌症的15%,乳腺癌是女性癌症相关死亡的常见原因。 而且任何年龄段的女性都有可能患乳腺癌。所以早期发现并治疗乳腺癌的关键就是预防性筛查,世界上许 多国家都已经成功的启动了筛查计划。但是相关的医疗资源对大部分人来说都是稀缺的,特别是针对癌症 这种严重性疾病的专家及医务人员更少,存在医疗资源分配不均匀问题。所以将机器学习应用到癌症诊断 领域可以很大程度提高诊断效率。
集成学习算法通过将多个弱分类器组合为强分类器来提高模型的稳定性和准确性。XGBoost属于 集成学习算法中的一种,是GBDT算法上的提升。XGBoost算法对损失函数做了二阶的泰勒展开提高了模型 准确率,并在目标函数之中加入了正则项对整体求最优解,用以权衡目标函数的下降和模型复杂程度,避 免过拟合。在应用于特征提取和数据分类时具有很好的性能优势,将其应用于乳腺癌诊断领域,能够解决 实际问题,但当前还比较缺乏此类应用。
XGBoost模型的性能与参数的设置有关,合理的参数设置可以大大提升模型的整体效果。传统的 手动调参通过人工的方式检查随机参数集来训练算法,但是这种手动方式不能保证得到最佳参数组合,现 有的且使用比较广泛的就是网格搜索和随机搜索算法,但是随机搜索与手动调参相似结果不能保证,网格 搜索存在资源消耗大的问题且因为没有考虑之前的参数信息则容易陷入局部最小值,所以需要提出新的有 效的调参方法来提升模型训练效果。
飞蛾扑火优化算法(Moth-flame optimization algorithm,MFO)是SeyedaliMirjalili等于2015 年提出的一种新型智能优化算法,为优化领域提供了一种新的启发式搜索范式:螺旋搜索,该算法具有并 行优化能力强,全局性优且不易落入局部极值的性能特征。本发明先利用默认参数的XGBoost对原始乳腺 癌数据集进行特征提取降低样本数据维度,然后利用飞蛾扑火优化算法优化XGBoost模型的参数获得最佳 参数集,最后训练优化后的XGBoost模型并采用10折交叉验证验证模型的性能。
发明内容
本发明的目的是为了解决在乳腺癌诊断领域中诊断准确率和诊断速度的问题,提出了一种基于飞 蛾扑火优化算法的XGBoost乳腺癌诊断方法,本方法使用了XGBoost特征提取算法和改进的XGBoost分类 器模型,提高乳腺癌诊断的效率和准确率。
本发明的目的可以通过以下技术方案来实现:
一种基于飞蛾扑火优化算法的XGBoost乳腺癌诊断方法,包括以下步骤:
1)获取原始乳腺癌数据集并进行归一化处理;
2)采用XGBoost特征选择方法对原始乳腺癌数据集进行特征选择,降低数据集维度;
3)将降维后的乳腺癌数据集按照固定比例划分为训练集和测试集;
4)采用飞蛾扑火优化算法优化XGBoost模型参数,确定最优参数集;
5)利用训练样本集训练优化后的XGBoost分类模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110018388.8/2.html,转载请声明来源钻瓜专利网。