[发明专利]一种基于改进型萤火虫算法的特征选择方法在审

专利信息
申请号: 201811579282.X 申请日: 2018-12-24
公开(公告)号: CN110020661A 公开(公告)日: 2019-07-16
发明(设计)人: 尹胜;刘磊;罗蓉;罗志勇;李洪丞;刘益通 申请(专利权)人: 重庆邮电大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/00;G10L25/03
代理公司: 暂无信息 代理人: 暂无信息
地址: 400065*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 算法 萤火虫算法 萤火虫 特征选择 特征子集 改进型 搜索 工程应用领域 机器学习模型 最优特征子集 个体差异性 方向搜索 候选数据 候选特征 机器学习 精英个体 评估结果 全局搜索 数据特征 数据挖掘 算法迭代 种群优化 变步长 离散化 收敛性 自适应 寻优 子集 优化 输出 评估 探索 保证
【说明书】:

发明提供了一种基于改进型萤火虫算法(Elite‑individual‑differentiation Dynamic Step Firefly Algorithm,EDSFA)的特征选择方法,属于数据挖掘和机器学习任务中数据特征工程应用领域,包括以下步骤:1)将EDSFA进行离散化实现,得到适用于优化搜索候选数据特征子集的EDSBFA,每只萤火虫代表一个候选特征子集;2)利用机器学习模型对EDSBFA产生的特征子集进行评估,评估结果用于指导EDSBFA的优化搜索;3)经过数次算法迭代,由EDSBFA输出最优特征子集。本发明中EDSFA使用基于精英个体划分的变步长策略,考虑了萤火虫个体差异性而进行自适应寻优,算法兼顾了解空间的全局搜索和局部探索,降低算法陷入局部最优的风险,同时使算法朝着种群优化的方向搜索,保证了算法的可收敛性。

技术领域

本发明提供了一种基于改进型萤火虫算法(Elite-individual-differentiationDynamic Step Firefly Algorithm,EDSFA)的特征选择方法,属于数据挖掘和机器学习任务中数据特征工程应用领域。

背景技术

特征选择(Feature Selection)是机器学习、数据挖掘任务中,对于高维或冗余特征数据集采取的一种数据预处理方法。特征选择可以移除原数据集中冗余、不相关的噪音特征,从原数据集中获取一个最优的特征子集以提升机器学习模型的预测精度,同时最优特征子集相较于原特征集具有更少的特征数据,利用其进行机器学习模型的训练和预测可以极大地降低运行时间与数据存储方面的开销。机器学习领域中主要有两类特征选择方式:过滤式(filter mode)和包装式(wrapper mode)。包装式通常会取得比过滤式更好的特征选择结果,包装式比过滤式占用更长运算时间,在非海量数据规模且机器学习模型固定的情况下宜选用这种方式。本发明的特征选择方法为包装式的方法。特征选择算法像基于贪心或完备思想的算法虽可在原始数据集上找到最优特征子集,但这些算法为找到全局最优解需要付出高昂的计算代价。特征选择是一个0-1规划的组合优化问题,被证明是NP难题,而一些元启发式或生物启发式优化算法已在求解此类NP难组合优化问题中表现出了良好的性能,其在解决特征选择问题方面的研究,近年来受到学术界越来越多的关注,遗传算法(Simple Genetic Algorithm,SGA)与离散粒子群优化(Binary Particle SwarmOptimization,BPSO)等传统生物启发式算法已成功用于特征选择优化。

萤火虫算法(Firefly Algorithm,FA)是新型的生物启发式群智能优化算法,FA由剑桥大学Xin-She Yang教授在2008年提出,具有多目标优化能力,在组合优化领域,国内外学者对FA都进行了一定的研究与改进。标准FA设置参数少,算法步骤和公式较简单,然而其最优解发现率低、搜索易陷入局部最优、求解速度慢,其中步长参数取值大小对其性能影响很大,但标准FA采用固定步长设置,这存在着寻优局限性。因此本发明做了关于FA的性能改进,在遵循标准FA算法机理的基础上,提出了基于精英个体划分的变步长FA(Elite -individual-differentiation Dynamic Step Firefly Algorithm,EDSFA),并将EDSFA进行离散化实现,提出EDSFA的相应离散化算法EDSBFA(Elite-individual-differentiationDynamic Step Binary Firefly Algorithm,EDSBFA)用于机器学习任务中的特征选择优化。

发明内容

针对标准萤火虫算法(Firefly Algorithm,FA)寻优效率低、搜索易陷入局部最优,本发明提出基于精英萤火虫个体划分的变步长策略以改进FA的寻优能力。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811579282.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top