[发明专利]一种基于机器学习的WEB应用防火墙的实现方法在审

申请号：	201811480567.8	申请日：	2018-12-05
公开（公告）号：	CN109639659A	公开（公告）日：	2019-04-16
发明（设计）人：	王淑娥	申请（专利权）人：	四川长虹电器股份有限公司
主分类号：	H04L29/06	分类号：	H04L29/06;H04L29/08;G06K9/62
代理公司：	四川省成都市天策商标专利事务所 51213	代理人：	郭会
地址：	621000 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	防火墙测试阶段分类模型基于机器机器学习训练阶段异常检测防火墙规则测试样本动态更新集合建立建立模型最小模型构造能规则库向量化样本学习智能重建分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于机器学习的WEB应用防火墙的实现方法，其特征在于，所述方法采用单分类模型建立规则的机器学习方法，构造能充分表达白样本的最小模型作为Profile，从而实现异常检测，该方法包括训练阶段和测试阶段；其中，所述训练阶段用于建立单分类模型，具体包括以下步骤：

S1、通过N-Gram模型将训练样本的文本数据向量化，得到文本数据训的向量集；

S2、降低向量集的维度，对N-Gram的向量进行聚类，指定的类别数K即为约减后的特征维数，并将约减后的特征向量投入单分类SVM模型中进行Profile训练；

S3、采用深度学习中的深度自编码网络模型进行非线性特征约减，通过给定输入的重建误差，判断输入样本是否与Profile相符；

所述的测试阶段，对测试样本向量化，再通过计算重建误差作为异常检测的标准。

2.根据权利要求1所述的基于机器学习的WEB应用防火墙的实现方法，其特征在于，所述步骤S1包括以下步骤：

S11、通过长度为N的滑动窗口算法将文本数据分割为N-Gram序列；

S12、将N-Gram序列转化成向量。

3.根据权利要求2所述的基于机器学习的WEB应用防火墙的实现方法，其特征在于，所述步骤S12具体如下：

假设共有m种不同的字符，则会得到m*m种N-Gram的组合，用一个m*m长的向量，每一位独热码表示文本数据中是否出现了该N-Gram，其中有独热码则置1，没有则置0，从而可得到一个m*m长的0/1向量，对于每个出现的N-Gram，用该N-Gram在文本数据中出现的频率来代替单调的“1”，以表示更多的信息，则每个文本数据都可以通过一个m*m长的向量表示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司，未经四川长虹电器股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811480567.8/1.html，转载请声明来源钻瓜专利网。

上一篇：用于电力二次系统运维的防火墙的数据传输方法及装置
下一篇：电销外呼管理系统

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于机器学习的WEB应用防火墙的实现方法在审

专利文献下载