[发明专利]一种基于语义分析及向量化大数据的XSS入侵识别方法在审
申请号: | 202011567690.0 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112580050A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 张海军;陈映辉 | 申请(专利权)人: | 嘉应学院 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F40/284;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安研创天下知识产权代理事务所(普通合伙) 61239 | 代理人: | 郭璐 |
地址: | 514015 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 分析 量化 数据 xss 入侵 识别 方法 | ||
本发明公开了一种基于语义分析及向量化大数据的XSS入侵识别方法,首先,利用自然语言处理方法进行了数据获取、数据清洗、数据抽样以及特征提取等数据预处理;其次,基于神经网络的词向量化算法,实现了词向量化得到词向量大数据;再次,利用不同深度的深层神经网络智能检测算法实现了安全防护检测;最后,通过设计不同的超参数并对模型进行训练,得到了最大识别率、最低识别率、识别率均值、方差、标准差、识别率变化过程曲线图、损失误差变化过程曲线图和词向量样本余弦距离变化曲线图等结果。结果证明本发明的提出的XSS入侵识别方法识别率高,稳定性好,总体性能优良。
技术领域
本发明属于入侵识别检测技术领域,具体涉及一种基于语义分析及向量化大数据的XSS入侵识别方法。
背景技术
近年来,随着大数据技术的发展,在产生大量数据的同时,网络空间的形势愈发严峻。基于WEB应用的攻击逐渐成为主要攻击,例如最常见有跨站脚本攻击(Cross-SiteScripting,XSS)。目前传统的检测方法是利用病毒特征库中的已有特征,通过提取相应样本的特征,在病毒库搜索比较是否存在相匹配的特征来确定病毒。而这种基于检测方法存在局限性:规则库的建立与维护需要耗费人力物力,且这种方法适合检测已知病毒,难以检测新出现的病毒,而在大数据安全中这种检测方法极大影响了检测效率。
随着机器学习不断发展,利用深度学习网络强大的自适应性、自学习能力在网络安全监测上将成为主流趋势,其能够检测未知特征的攻击行为,从而提高检测率。
因此,如何在面向大数据时,为弥补传统算法存在的不足,提出一种更加先进的针对XSS攻击的入侵识别方法是目前亟待解决的问题。
发明内容
针对上述存在的问题,本发明旨在提供一种基于语义分析及向量化大数据的XSS入侵识别方法,利用深度学习网络强大的自适应性、自学习能力,设计深层神经网络算法来实现安全防护检测,通过大数据训练模型从而实现智能检测。
为实现本发明目的,本发明的技术解决方案为:
一种基于语义分析及向量化大数据的XSS入侵识别方法,其特征在于,包括以下步骤:
步骤1:获取待检测数据,进行文本切割、清洗、分词、词性标注、去停用词,得到预处理后的数据;
步骤2:构建基于连续词袋模型CBOW实现的词向量化模型,采用词向量化算法将预处理后的数据映射为分布式词向量;
步骤3:将词向量化的样本进行统计,得到正样本数据集和负样本数据集,并将两个数据集合并得到词向量化大数据样本集,且将大数据样本集随机划分为训练集和测试集,数量比为7:3;
步骤4:将词向量化大数据样本集中的样本输入到不同深度的深层神经网络DNN中进行训练,确定各深层所述深层神经网络DNN中的各项超参数;
步骤5:实时采集HTTP请求的数据,对HTTP请求进行攻击检测,识别入侵攻击行为。
本方法与现有技术相比,具有以下有益效果:
本发明利用自然语言处理方法进行数据获取,数据清洗,数据抽样,特征提取等数据预处理;并设计了基于神经网络的词向量化算法,实现了词向量化得到词向量大数据;利用不同深度的深层神经网络DNN进行超参数调整,通过该深层神经网络DNN检测算法能够对XSS攻击能够进行智能监测;通过实验结果可以看出,本发明提出的检测方法具有识别率高,稳定性好,总体性能优良等优点。
附图说明
图1是基于语义情景分析与机器学习的入侵智能检测原理图;
图2是对第Ⅰ类大数据集基于不同的学习率μ进行20次实验时得到的识别率曲线图;
图3是对第Ⅱ类大数据集基于不同的学习率μ进行20次实验时得到的识别率曲线图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉应学院,未经嘉应学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567690.0/2.html,转载请声明来源钻瓜专利网。