[发明专利]一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法在审
申请号: | 202111465468.4 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114282130A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 许国良;魏安;雒江涛 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F17/16;G06N3/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 廖曦 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 选择 变异 飞蛾 火焰 优化 算法 欺诈 网址 识别 方法 | ||
本发明涉及一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法,属于大数据领域。该方法包括获取原始数据,对原始数据进行预处理,并利用处理后的原始数据进行特征提取;通过初始化飞蛾种群,计算飞蛾个体的适应度值,并利用螺旋形状运动的方式更新飞蛾个体的值,根据计算得到控制因子和自适应因子的值选择不同的变异策略,不断重复进行上述操作,直到达到设置的终止条件输出最优特征子集;将最优特征子集作为输入数据训练分类算法,完成欺诈网址识别模型的构建;本发明解决了传统欺诈网址识别模型特征选择困难、易陷入局部最优点和识别准确率不高等问题。
技术领域
本发明属于大数据领域,涉及一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法。
背景技术
网络环境安全主要面临以下的挑战,通过在网址中植入木马或者僵尸控制程序控制用户的主机;通过篡改、仿冒有信誉的网址或者在网址中植入后门诱惑网络用户进行欺诈;通过利用网址中存在的高危漏洞来实施远程攻击;以上方式主要是诱惑网络用户点击欺诈者设计好的网址盗取用户的个人信息和财产信息。因此,如果能够通过技术手段识别出具有欺诈风险的网址,可以从根源处解决大部分网络诈骗的问题,净化网络空间的环境。
传统识别欺诈网址技术主要分为两类,分别是黑名单技术以及通过提取网址数据特征并训练机器学习模型完成欺诈网址的识别,这两类技术被广泛使用并展现了一定的效果。但是随着网络环境中网址数量的飞速增长,欺诈网址通常会缩短生命周期逃避黑名单技术的检测,降低了黑名单技术识别欺诈网址的准确率。提取网址数据特征技术,通过分析网址URL关键词特征、网址主机信息特征、网页页面内容特征等识别欺诈网址,能够解决黑名单技术的不足,然而该方法没有考虑到数据集中存在冗余以及提取的特征会给模型带来负面影响的情况,在一定程度上干扰了模型的训练。因此,针对传统识别欺诈网址技术存在特征选择困难、识别准确率不高的问题,本发明引入飞蛾火焰优化算法完成特征优选。然而,飞蛾火焰优化算法存在易陷入局部最优点以及全局搜索能力不高的问题影响该算法缩减维度能力。因此,本发明提出一种选择变异飞蛾火焰优化算法解决网址数据特征优选问题,并结合随机森林算法完成欺诈网址的识别,该方法能够有效平衡算法全局寻优和局部寻优的能力,解决传统欺诈网址识别技术特征选择困难的问题,在最大化识别能力的同时最小化特征的数量。
发明内容
有鉴于此,本发明的目的在于提供一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法。
为达到上述目的,本发明提供如下技术方案:
一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法,该方法包括以下步骤:
S1:获取网址原始数据集,对原始数据集进行预处理,然后利用处理过后的原始数据集提取网址的URL关键词特征、网址主机信息特征、网址页面内容特征和网址JavaScript特征;
S2:根据网址数据集的大小以及提取特征的数量设置飞蛾种群的大小以及飞蛾个体维度的数量,并初始化飞蛾种群M;
S3:对飞蛾个体进行离散化处理,并计算每个飞蛾个体的适应度值存储到适应度矩阵OM中,对适应度矩阵OM进行排序,根据火焰数量自适应调整公式计算得到火焰数量flamenum,存储对应的数据到火焰矩阵F中,计算飞蛾个体到对应火焰的距离Dij,然后更新飞蛾个体的值;
S4:通过更新后的飞蛾个体计算控制因子自适应因子CA和自适应因子的下限CA_L,根据计算的结果选择不同的变异策略,包括三种变异策略分别是最优点变异策略、随机变异策略和高斯变异策略;最优点变异策略用于增强最优解领域搜索的能力;随机变异策略用于增强算法的全局搜索能力;高斯变异策略用于逐渐将算法从全局搜索变为局部搜索;
S5:当选择最优点变异策略和随机变异策略时,通过引入缩放因子平衡算法种群多样性和局部收敛的能力;根据选择的变异策略计算变异后个体适应度值的大小,如果优于原先个体的适应度值,则用变异个体取代原先飞蛾个体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465468.4/2.html,转载请声明来源钻瓜专利网。