[发明专利]一种混合ABC和CRO的高维特征选择方法在审
申请号: | 201910381688.5 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110097169A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 阎朝坤;张戈;王建林;和婧;闫永航 | 申请(专利权)人: | 河南大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 俞晓明 |
地址: | 475001 河南省*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种群 特征选择 高维 一次迭代 初始化 适应度 迭代 算法 生物信息学技术 全局搜索能力 人工蜂群算法 交叉验证法 全局最优解 适应度函数 种群多样性 化学反应 精英保留 食物源 更新 验证 | ||
本发明涉及生物信息学技术领域,公开了一种混合ABC和CRO的高维特征选择方法,包括:采用基于人工蜂群算法ABC以寻找最好食物源即函数适应度的策略对个体组成的种群进行初始化;采用化学反应算法CRO更新初始化种群,并采用设定的适应度函数计算种群中个体的适应度值,得到种群中的全局最优解;采用精英保留策略形成精英分子种群,并在一次迭代结束后更新精英种群,将所得到的精英分子并入种群中进行下一次迭代,直至当前迭代次数达到设定的迭代次数;采用10倍交叉验证法结合KNN分类器来验证高维特征选择的性能,这种混合ABC和CRO的高维特征选择方法,提高算法的全局搜索能力,增强种群多样性,在一定程度避免陷入局部最优。
技术领域
本发明涉及生物信息学领域,特别涉及一种混合ABC和CRO的高维特征选择方法。
背景技术
现实应用中存在着大量的高维数据集,虽然高维数据可能更精确地表示事物,但是随着描述数据的特征数目越来越多,数据维度越来越高,而其中相当一部分特征可能与挖掘任务是不相关的或特征之间相互冗余。这些不相关的特征不仅因为数据纬度高而降低数据分析任务的性能,而且冗余特征也可能降低数据分析任务的准确性。鉴于提取有价值的信息和确定大数据集的重要特征方面的挑战,特征选择(也称为变量选择或属性选择)已经引起诸多领域的兴趣。特征选择应用于具有已知特征的数据集,尝试识别数据的重要特征,并从原始特征集中丢弃不相关或冗余的特征。随着信息技术的迅速发展,传统的模式识别技术已无法满足处理高维小样本数据中大量不相关特征的要求,提高特征选择算法的性能变得越来越重要。
通常特征选择过程包含以下阶段:子集生成,子集评估和结果验证。这个过程的目的是去除不相关或冗余特征,生成的较小的可行子集。常用的特征选择方法分为Filter、Wrapper和Embedded三类。对于Filter模型,利用数据本身固有的分布特性作为特征选择的依据,而不利用任何挖掘算法,如T-test算法。Wrapper模型依赖于分类方法对特征子集的评估,这使Wrapper模型在三种方法中拥有较高的分类精度,如SA算法。Embedded模型则直接将特征选择过程融入到标签学习算法中,如决策树。相对而言,Wrapper模型利用机器学习算法的性能作为评估标准来进行特征选择,使得Wrapper模型更加灵活而且在处理高维数据时更加有效。近年来,Wrapper模型通过元启发式方法解决特征选择问题寻求全局最优解引起了很多关注。
Vieira等提出了一种改进的二进制粒子群优化算法(MBPSO)用于特征选择,同时优化SVM内核参数设置来对脓毒症患者的死亡率进行预测。
Subanya等使用二进制人工蜂群算法(BABC)来找到心脏疾病识别中的最佳特征子集,然后利用KNN模型来评估这些选择的特征。
Hu等提出了一种改进的混合蛙跳算法(ISFLA)进行特征选择,该算法通过引入混沌记忆权重因子,绝对平衡组策略及自适应转移因子,提高了特征选择的准确率和性能。
Babatunde等使用遗传算法(GA)结合K最近邻(KNN)分类器进行特征选择,该方法在分类精度等多个指标上获得比以往一些方法有更好的结果。
Li等将改进的灰狼优化算法(IGWO)和内核极限学习机(KELM)结合进行特征选择。先采用遗传生成多样化的初始位置,然后利用灰狼优化来更新离散搜索空间中种群的当前位置,从而得到最优特征子集。
尽管上述用于特征选择的启发式算法有各自的优点,但是没有任何一个元启发式算法能够解决所有的特征选择问题。因此我们需要探索新的元启发式搜索算法或是混合搜索算法应用在生物医学特征选择中。本发明提出了一种新的基于元启发式的混合算法AB-CRO算法,该算法结合了人工蜂群算法(ABC)和化学反应算法(CRO)的特点来优化特征选择。
发明内容
本发明提供一种混合ABC和CRO的高维特征选择方法,可以解决现有技术中的上述问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910381688.5/2.html,转载请声明来源钻瓜专利网。