[发明专利]一种异常SQL检测模型构建方法及检测方法在审
申请号: | 202110623664.3 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113343051A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李伟伟;周诚;郭志民;杨文;李鸣岩 | 申请(专利权)人: | 全球能源互联网研究院有限公司;国网河南省电力公司电力科学研究院;国家电网有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
地址: | 102209 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异常 sql 检测 模型 构建 方法 | ||
本申请提供一种异常SQL检测模型构建方法及检测方法,该异常SQL检测模型构建方法包括:获取带标记SQL语句集合和未标记SQL语句集合;根据带标记SQL语句集合和未标记SQL语句集合,分别确定带标记特征向量集合和未标记特征向量集合;根据带标记特征向量集合和未标记特征向量集合之间的比对结果,从未标记特征向量集合中提取目标负样本;将带标记特征向量集合和目标负样本输入至预设的异常SQL检测模型,以对异常SQL检测模型进行模型训练,得到目标异常SQL检测模型。进一步扩充了训练样本量,从而提高了异常SQL检测模型的可靠性,为提高SQL检测结果的准确性奠定了基础。
技术领域
本申请涉及安全检测技术领域,尤其涉及一种异常SQL检测模型构建方法及检测方法。
背景技术
随着互联网的高速发展,海量的数据被存储在数据库中,数据库的安全问题是网络安全领域的重中之重。异常SQL的执行会造成重要信息的泄露、丢失等严重的问题。为了保障数据库的安全性,异常SQL检测成为了目前人们关注的重点问题。
在现有技术的异常SQL检测方法主要是基于监督学习技术,首先需要收集业务SQL语句以及可能会对数据库产生攻击的异常SQL语句,并对这些语句进行标记,从而获得训练数据。
但是,在实际场景中,一个业务每天会产生海量的SQL语句,这些SQL语句多数是符合业务要求的,异常的SQL语句很少出现。导致可用训练样本量不足,不利于保障异常SQL检测模型的可靠性。
发明内容
本申请提供一种异常SQL检测模型构建方法及检测方法,以解决现有技术难以保障异常SQL检测模型的可靠性等缺陷。
本申请第一个方面提供一种异常SQL检测模型构建方法,包括:
获取带标记SQL语句集合和未标记SQL语句集合;
根据所述带标记SQL语句集合和未标记SQL语句集合,分别确定带标记特征向量集合和未标记特征向量集合;
根据所述带标记特征向量集合和所述未标记特征向量集合之间的比对结果,从所述未标记特征向量集合中提取目标负样本;
将所述带标记特征向量集合和目标负样本输入至预设的异常SQL检测模型,以对所述异常SQL检测模型进行模型训练,得到目标异常SQL检测模型。
可选的,所述根据所述带标记特征向量集合和所述未标记特征向量集合之间的比对结果,从所述未标记特征向量集合中提取目标负样本,包括:
判断各特征元素在带标记特征向量集合中出现的次数是否小于所述特征元素在未标记特征向量集合中出现的次数;
若是,则将所述特征元素确定为目标特征元素;
从所述未标记特征向量集合中提取包含所述目标特征元素的未标记特征向量,并将所述未标记特征向量确定为目标负样本。
可选的,所述根据所述带标记特征向量集合和所述未标记特征向量集合之间的比对结果,从所述未标记特征向量集合中提取目标负样本,包括:
计算所述带标记特征向量集合中的带标记特征向量和未标记特征向量集合中的未标记特征向量之间的相似度;
判断各未标记特征向量与带标记特征向量之间的相似度是否小于预设相似度阈值;
若是,则将所述未标记特征向量确定为目标负样本。
可选的,所述方法还包括:
将不包含所述目标负样本的未标记特征向量集合,确定为未标记训练集合;
将所述未标记训练集合输入至所述目标异常SQL检测模型,并得到各未标记训练样本对应的检测结果和置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;国网河南省电力公司电力科学研究院;国家电网有限公司,未经全球能源互联网研究院有限公司;国网河南省电力公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110623664.3/2.html,转载请声明来源钻瓜专利网。