[发明专利]一种基于樽海鞘群算法支持向量机的网络钓鱼检测方法有效
申请号: | 201910031356.4 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109873810B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 叶志伟;孙一恒;王春枝;金灿;孙爽;杨娟;郑逍;陈凤;苏军;严灵毓 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06N3/00;G06K9/62 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 周新楣 |
地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海鞘 算法 支持 向量 网络 钓鱼 检测 方法 | ||
1.一种基于樽海鞘群算法支持向量机的网络钓鱼检测方法,其特征在于,包括以下步骤:
步骤1:对网站数据进行处理;
解析网站的URL特征、域名信息以及Web页面特征,并进行数值化和归一化处理,划分训练集,验证集和测试集;
步骤2:随机初始化樽海鞘群算法的参数,包括樽海鞘群数量N、迭代次数L、以及维度dim、樽海鞘个体的位置X以及参数的上下界;其中维度dim表示需要优化的参数的维度,樽海鞘的个体位置X表示为支持向量机的参数C和g的值,参数的上下界表示为参数的寻优范围;
步骤3:计算樽海鞘群的适应度值,将每个樽海鞘个体位置X传入支持向量机中,作为当前支持向量机的参数,然后使用支持向量机对数据集进行分类,返回的分类精确度表示为当前的个体的适应度值;
步骤4:按照适应度大小,将适应度值最大的樽海鞘设置为领导者,其余的樽海鞘设置为跟随者;
步骤5:更新樽海鞘群中个体的位置;
步骤5的具体实现包括以下子步骤:
步骤5.1:按照公式(1)更新作为领导者的樽海鞘的位置;
其中,表示为第一个作为领导者的樽海鞘在第j个维度上的位置,Fj表示为在第j个维度上的食物源,即表示为第j个维度上的当前最优解,ubj表示第j个维度上的作为领导者的樽海鞘个体的位置上限,lbj表示为第j个维度上作为领导者的樽海鞘个体的下限,通过上限和下限控制每个维度上的搜索范围;c1,c2,c3随机数,其中c2取0到1的随机数,c3≥0时取0到1的随机数;l表示为一个当前的迭代次数,L表示为总的迭代次数;
步骤5.2:按照公式(3)更新作为跟随者的樽海鞘的位置;
其中,i≥2,表示第i个作为跟随者的樽海鞘的位置;
步骤6:判断终止条件,是否达到迭代次数或者适应度值不在提高;
若否,则回转执行步骤3:
若是,则输出作为领导者的樽海鞘的位置,即为最佳的支持向量机参数C和g;
步骤7:使用支持向量机来对钓鱼网站进行检测和判别。
2.根据权利要求1所述的基于樽海鞘群算法支持向量机的网络钓鱼检测方法,其特征在于:步骤1中,所述URL特征包括有无IP地址、有无异常的字符、URL的长度、端口号以及子域名的状态;所述域名信息包括域名的注册时间、DNS记录以及网页级别;所述Web页面特征包括链接对象、表单对象以及JavaScript脚本语言;特征类型分别为连续型和离散型,将其转化为数值对象并进行归一化。
3.根据权利要求1所述的基于樽海鞘群算法支持向量机的网络钓鱼检测方法,其特征在于:步骤3中所述樽海鞘群的适应度值,是表示为支持向量机对于钓鱼网站的检测准确率,具体计算公式为:
式中,TP表示支持向量机检测训练集时将正类的样本分类为正类的数量,FP表示为支持向量机检测测试集时将正类的样本分类为反类的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910031356.4/1.html,转载请声明来源钻瓜专利网。