[发明专利]一种基于历史数据的癌症疾病基因特征选择方法有效
申请号: | 201910355711.3 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110070916B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 邱剑锋;郭能;张兴义;苏延森 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06F18/2111 | 分类号: | G06F18/2111;G16B40/20 |
代理公司: | 合肥兴东知识产权代理有限公司 34148 | 代理人: | 王伟 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于历史数据的癌症疾病基因特征选择方法,包括以下步骤:A:将癌症疾病基因数据分为训练集和测试集;B:计算训练集上所有特征都被选择后的总平均错误率;C:生成初始种群,构造适应度函数;D:将所有特征选择方案记录到特征树中,调整特征选择方案的分布,以适应度值最小的特征选择方案作为最优特征选择方案,将结果返回给遗传算子和导向搜索算子;E:引导特征种群的进化方向;F:判断终止条件,若未达到终止条件,重复步骤D~F,若达到终止条件,输出最优解。本发明的优点在于:能够有效降低数据维度,提高预测准确性,通过特征树,结合遗传算法为癌症等疾病的相关基因进行筛选,为诊断和治疗提供辅助。 | ||
搜索关键词: | 一种 基于 历史数据 癌症 疾病 基因 特征 选择 方法 | ||
【主权项】:
1.一种基于历史数据的癌症疾病基因特征选择方法,其特征在于:包括以下步骤:步骤A:将癌症疾病基因数据分为训练数据集和测试数据集;步骤B:利用五折交叉计算训练数据集上所有特征都被选择后的总平均错误率;步骤C:随机生成初始化特征种群,构造用于评价特征选择方案的适应度函数;步骤D:将特征种群中的特征选择方案依次记录到特征树中,调整特征选择方案的分布,得到调整后的特征种群,以适应度值最小的特征选择方案作为最优特征选择方案。步骤E:根据遗传算子和导向搜索算子引导特征种群的进化方向;将特征树所优化的特征种群作为父代种群,利用遗传算子产生子代种群;将最优特征选择方案所在的特征树的位置信息作为搜索方向,利用导向搜索算子加强局部搜索;步骤F:判断终止条件,若未达到终止条件,重复步骤D~F,若达到终止条件,输出最优特征选择方案,在测试集上验证最优特征选择方案的分类错误率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910355711.3/,转载请声明来源钻瓜专利网。