[发明专利]一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法在审
申请号: | 202111465468.4 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114282130A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 许国良;魏安;雒江涛 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F17/16;G06N3/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 廖曦 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 选择 变异 飞蛾 火焰 优化 算法 欺诈 网址 识别 方法 | ||
1.一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法,其特征在于:该方法包括以下步骤:
S1:获取网址原始数据集,对原始数据集进行预处理,然后利用处理过后的原始数据集提取网址的URL关键词特征、网址主机信息特征、网址页面内容特征和网址JavaScript特征;
S2:根据网址数据集的大小以及提取特征的数量设置飞蛾种群的大小以及飞蛾个体维度的数量,并初始化飞蛾种群M;
S3:对飞蛾个体进行离散化处理,并计算每个飞蛾个体的适应度值存储到适应度矩阵OM中,对适应度矩阵OM进行排序,根据火焰数量自适应调整公式计算得到火焰数量flamenum,存储对应的数据到火焰矩阵F中,计算飞蛾个体到对应火焰的距离Dij,然后更新飞蛾个体的值;
S4:通过更新后的飞蛾个体计算控制因子λik、自适应因子CA和自适应因子的下限CA_L,根据计算的结果选择不同的变异策略,包括三种变异策略分别是最优点变异策略、随机变异策略和高斯变异策略;最优点变异策略用于增强最优解领域搜索的能力;随机变异策略用于增强算法的全局搜索能力;高斯变异策略用于逐渐将算法从全局搜索变为局部搜索;
S5:当选择最优点变异策略和随机变异策略时,通过引入缩放因子平衡算法种群多样性和局部收敛的能力;根据选择的变异策略计算变异后个体适应度值的大小,如果优于原先个体的适应度值,则用变异个体取代原先飞蛾个体;
S6:判断是否达到设置的终止条件;
S7:如否,则返回执行S3,继续寻找最优飞蛾个体;如是,则输出当前最优飞蛾个体所选择的特征,并训练分类算法完成欺诈网址识别方法的构建。
2.根据权利要求1所述的一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法,其特征在于:所述S1中,对网址原始数据进行预处理以及提取网址特征数据过程包括:
S11:对收集的网址原始数据进行清洗,删除无效数据和异常数据,得到处理过后的网址数据集U;
S12:通过对处理后网址数据集U的URL关键词和主机信息进行分析,提取网址的URL关键词特征和网址的主机信息特征;
S13:通过对网址数据集U的页面内容和JavaScript代码进行分析,提取网址的页面特征和JavaScript特征;
S14:结合S12和S13提取的特征,形成网址特征向量U(i)=(ui1,ui2,...,uij,...,uid),其中uij代表提取的某一特征。
3.根据权利要求2所述的一种基于选择变异飞蛾火焰优化算法的欺诈网址识别方法,其特征在于:所述S2中,改进飞蛾火焰优化算法个体更新过程包括:
S21:根据网址数据集的大小以及提取特征的数量设置飞蛾种群的大小以及飞蛾个体维度的数量,初始化飞蛾种群矩阵M=[Mij]n×d,并对其进行离散化处理,通过适应度函数计算每个飞蛾个体的适应度值,存储到适应度矩阵OM=[OMi]n,并对其进行排序;
S22:如果是初次迭代,将排序过后的飞蛾适应度矩阵OM存储到火焰适应度矩阵OF=[OFi]n,并将对应的飞蛾个体存储到火焰矩阵F=[Fij]n×d;
S23:如果不是初次迭代,通过火焰数量自适应调整公式计算当前迭代过程火焰数量flamenum,并利用飞蛾适应度矩阵OM更新火焰适应度矩阵OF,同时利用对应的飞蛾个体更新火焰矩阵F;
S24:根据火焰矩阵F,使飞蛾个体采用螺旋形状运动的方式更新其值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465468.4/1.html,转载请声明来源钻瓜专利网。