[发明专利]一种基于多目标演化算法的癌症检测方法有效
申请号: | 201810946352.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109360656B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 程凡;陈加宾;张兴义 | 申请(专利权)人: | 安徽大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 合肥市长远专利代理事务所(普通合伙) 34119 | 代理人: | 傅磊 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多目标 演化 算法 癌症 检测 方法 | ||
1.一种基于多目标演化算法的癌症检测方法,其特征在于,包括:
S1、通过多目标进化算法筛选初始癌症数据集,得到癌症检测数据模型;
S2、通过多目标集成算法提高癌症检测数据模型的准确度,得到癌症检测集成数据模型;
S3、通过癌症检测集成数据模型对目标癌症数据集进行癌症检测;
步骤S1,具体包括:
S11、通过十折交叉将初始癌症数据集划分为训练集和测试集,对训练集上的样本通过超立方体拉丁抽样生成初始种群,其中,所述初始种群包含N个个体,所述癌症数据集最后一列为样本标签,初始种群采用二进制编码,初始种群中个体对应位为1表示选取该样本,为0表示不选取该样本;
S12、将训练集属性特征转换成分类器处理的格式,对训练集中数据进行归一化,对训练集中每个个体中数据进行训练得到SVM模型;
S13、通过多目标进化算法对初始种群进行种群进化,在进化到第一预设次数代时,引导种群的个体中局部信息指引进化,在进化到第二预设次数代时,获取第一前沿面上的解,从第一前沿面上的解中剔除掉压缩率低于预设压缩率的解,再对剩下的解中每个解的附近均匀局部扰动产生等量的一组解,对这组解进行非支配排序和拥挤距离计算后,选出N个解,得到癌症检测数据模型;
步骤S2,具体包括:
S21、根据癌症检测数据模型的N个解随机初始化形成第二初始种群;
S22、通过多目标集成算法对第二初始种群进行种群进化,在进化到第二预设次数代时,从父代子代中通过非支配排序和拥挤距离选出最终pareto面上的一组解,得到癌症检测集成数据模型。
2.根据权利要求1所述的基于多目标演化算法的癌症检测方法,其特征在于,步骤S12中,所述对训练集中每个个体中数据进行训练得到SVM模型,具体包括:
采用的是libsvm中高斯核函数对训练集中每个个体中数据进行训练得到SVM模型,其中,C=1,γ=0.01,计算准确度f1和压缩率f2,
T是整个训练集的大小,S是减少的训练集数目,yi是样本真实标签,yi*是样本预测标签,
3.根据权利要求1所述的基于多目标演化算法的癌症检测方法,其特征在于,步骤S13中,引导初始种群的个体中局部信息指引进化,具体包括:
获取种群中所有个体每一位上为1的数目S0,如果S0>S1,将种群中预设个数的个体中对应位置为1,如果S0<S2,就种群中预设为个数阈值个数的个体中对应位置为0,其中,S1、S2为预设的个数阈值。
4.根据权利要求1所述的基于多目标演化算法的癌症检测方法,其特征在于,步骤S22中,通过多目标集成算法对第二初始种群进行种群进化的过程中,还包括:
计算第一个目标f1,f1为集成精度;
计算第二个目标f2,其中,R1,R2,..Rn是每个模型对应的压缩率;
计算第三个目标f3,其中,N是第二阶段的编码长度,n是选中的进行集成的模型的个数。
5.根据权利要求1所述的基于多目标演化算法的癌症检测方法,其特征在于,步骤S3,具体包括:通过癌症检测集成数据模型对已经归一化的目标癌症数据集进行癌症检测,即可判断目标癌症数据集中样本为癌症样本或正常样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810946352.4/1.html,转载请声明来源钻瓜专利网。