[发明专利]一种数据检测方法及系统在审
申请号: | 201711024393.X | 申请日: | 2017-10-27 |
公开(公告)号: | CN109726727A | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 钱湖海;鲁银冰;林宇俊;许鑫伶;高瑞令 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/27 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 311100 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 请求数据 检测 数据检测 预设 支持向量机 传输协议 检测结果 历史请求 数据集合 后门 入侵 输出 | ||
1.一种数据检测方法,其特征在于,所述方法包括:
获取待检测请求数据,所述待检测请求数据为采用预设传输协议的请求数据;
基于训练后的支持向量机SVM模型对所述待检测请求数据进行检测,获得检测值;其中,所述训练后的SVM模型为根据历史请求数据集合训练所确定的、用于识别异常请求数据的模型;
确定所述检测值小于预设阈值,输出用于表征所述待检测请求数据为异常请求数据的检测结果。
2.如权利要求1所述的方法,其特征在于,在所述获取待检测请求数据之前,所述方法还包括:
获取包括至少两条历史异常请求数据的历史请求数据集合;
对所述历史请求数据集合中的每条历史请求数据进行词法分割,获得与所述历史请求数据集合对应的M个关键词及每个关键词对应的关键词特征信息,所述关键词特征信息包括相应关键词的出现次数,M为大于等于1的整数;
基于所述历史请求数据集合、所述M个关键词及每个关键词对应的关键词特征信息对待训练SVM模型进行训练,获得训练后的SVM模型。
3.如权利要求2所述的方法,其特征在于,在确定所述历史请求数据集合之前,所述方法还包括:
获取历史标签样本集合,所述历史标签样本集合中每个历史标签样本对应一条历史请求数据;
基于所述历史标签样本集合,确定所述历史请求数据集合。
4.如权利要求2或3所述的方法,其特征在于,所述基于所述历史请求数据集合、所述M个关键词及每个关键词对应的关键词特征信息对待训练SVM模型进行训练,获得训练后的SVM模型,包括:
基于所述关键词特征信息,确定所述M个关键词中出现次数从高到低排序后的前N个关键词作为特征关键词;其中,N为小于等于M的整数;
将所述历史请求数据集合中的每条历史请求数据与所述N个特征关键词进行匹配,获得多个N维特征向量,所述N维特征向量的个数与所述历史请求数据集合中的历史请求数据的条数相关;
基于所述多个N维特征向量对待训练SVM模型进行训练,获得训练后的SVM模型。
5.如权利要求4所述的方法,其特征在于,所述基于训练后的支持向量机SVM模型对所述待检测请求数据进行检测,获得检测值,包括:
对所述待检测请求数据进行词法分割,获得与所述待检测请求数据对应的至少一个关键词;
将所述至少一个关键词与所述N个特征关键词进行匹配,获得与所述待检测请求数据对应的预测特征向量;
将所述预设特征向量输入所述训练后的SVM模型,获得检测值。
6.一种数据检测系统,其特征在于,所述系统包括:
第一获取模块,用于获取待检测请求数据,所述待检测请求数据为采用预设传输协议的请求数据;
检测模块,用于基于训练后的支持向量机SVM模型对所述待检测请求数据进行检测,获得检测值;其中,所述训练后的SVM模型为根据历史请求数据集合训练所确定的、用于识别异常请求数据的模型;
输出模块,用于确定所述检测值小于预设阈值,输出用于表征所述待检测请求数据为异常请求数据的检测结果。
7.如权利要求6所述的系统,其特征在于,所述系统还包括:
第二获取模块,用于在获取待检测请求数据之前,获取包括至少两条历史异常请求数据的历史请求数据集合;
分割模块,用于对所述历史请求数据集合中的每条历史请求数据进行词法分割,获得与所述历史请求数据集合对应的M个关键词及每个关键词对应的关键词特征信息,所述关键词特征信息包括相应关键词的出现次数,M为大于等于1的整数;
训练模块,用于基于所述历史请求数据集合、所述M个关键词及每个关键词对应的关键词特征信息对待训练SVM模型进行训练,获得训练后的SVM模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团公司,未经中移(杭州)信息技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711024393.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频中的事件检测方法及装置
- 下一篇:一种训练数据生成方法及装置