[发明专利]模型训练方法、API请求过滤方法、装置和存储介质在审
申请号: | 202111627427.0 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114372519A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 陈鑫远;左绘 | 申请(专利权)人: | 天翼物联科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510335 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 api 请求 过滤 装置 存储 介质 | ||
1.一种模型训练方法,其特征在于,所述模型训练方法包括:
采集多个第一API请求数据;
对各所述第一API请求数据进行标准化格式处理,获得训练样本集;
对所述训练样本集按特征进行分类构建,获得自体集;
获取免疫检测器;
使用所述自体集对所述免疫检测器进行训练。
2.根据权利要求1所述的模型训练方法,其特征在于,所述采集多个第一API请求数据,包括:
通过爬虫程序主动爬取注入案例;
从所述注入案例中提取出所述第一API请求数据。
3.根据权利要求1所述的模型训练方法,其特征在于,所述对所述第一API请求数据进行标准化格式处理,得到训练样本集,包括:
使用特殊字符分离法和空格分离法对所述第一API请求数据进行处理,获得第一特征信息;
对所述第一特征信息进行标记化,获得令牌信息;
将所述令牌信息组建成攻击语句语法树;
以所述攻击语句语法树组成所述训练样本集。
4.根据权利要求1所述的模型训练方法,其特征在于,所述对所述训练样本集按特征进行分类构建,获得自体集,包括:
对所述训练样本集进行朴素贝叶斯聚类分析,根据所述朴素贝叶斯聚类分析的结果,将所述训练样本集中的内容分类到正常数据集或者异常数据集;
按照多叉树所需的特征属性标准,对所述正常数据集进行特征属性提取,获得第一特征属性;
以所述第一特征属性作为多叉树存储结构中每层结点的主属性,构造出所述自体集。
5.根据权利要求4所述的模型训练方法,其特征在于,所述模型训练方法还包括:
按照多叉树所需的特征属性标准,对所述异常数据集进行特征属性提取,获得第二特征属性;
以所述第二特征属性作为多叉树存储结构中每层结点的主属性,构造出所述非自体集;使用所述自体集和所述非自体集对所述免疫检测器进行训练。
6.根据权利要求5所述的模型训练方法,其特征在于,所述使用所述自体集和所述非自体集对所述免疫检测器进行训练,包括:
将所述免疫检测器的参数作为抗体,将所述自体集和所述非自体集中的数据作为抗原;
执行多轮迭代过程,直至所执行的迭代过程总轮数达到轮数阈值;在一轮所述迭代过程中,对所述抗体和所述抗原进行匹配,获得亲和度;当所述亲和度超过亲和度阈值,存储所述免疫检测器的参数,反之则更改所述免疫检测器的参数。
7.一种API请求过滤方法,其特征在于,所述API请求过滤方法包括:
获取第二API请求数据;
使用免疫检测器对所述第二API请求数据进行检测;所述免疫检测器经过权利要求1-6任一项所述的模型训练方法训练;
获取所述免疫检测器的检测结果;
根据所述免疫检测器的检测结果,识别所述第二API请求数据为正常请求或异常请求;
当识别所述第二API请求数据为正常请求,响应所述第二API请求数据;当识别所述第二API请求数据为异常请求,拒绝或忽略所述第二API请求数据。
8.一种API请求过滤方法,其特征在于,所述API请求过滤方法包括:
获取多个第二API请求数据;
对各所述第二API请求数据进行基于概率队列的排序;
按照排序后各所述第二API请求数据的顺序,使用免疫检测器依次对各所述第二API请求数据进行检测;所述免疫检测器经过权利要求1-6任一项所述的模型训练方法训练;
获取所述免疫检测器的检测结果;
根据所述免疫检测器的检测结果,识别各所述第二API请求数据为正常请求或异常请求;
响应被识别为正常请求的所述第二API请求数据,拒绝或忽略被识别为正常请求的所述第二API请求数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼物联科技有限公司,未经天翼物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111627427.0/1.html,转载请声明来源钻瓜专利网。