[发明专利]一种基于血缘关系的数据库审计方法有效
申请号: | 201910767801.3 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110457405B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 王启凡;魏国富;殷钱安;陈一根;余贤喆;陶景龙;刘胜 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/242;G06F21/62;G06K9/62 |
代理公司: | 北京艾皮专利代理有限公司 11777 | 代理人: | 刘媛 |
地址: | 200120 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 血缘关系 数据库 审计 方法 | ||
1.一种基于血缘关系的数据库审计方法,其特征在于,具体步骤如下:
步骤一,找出数据库的字段之间的血缘关系R:读取数据库操作记录中的SQL语句,对SQL语句进行解析,SQL语句的解析结果为:原始表名、原始列名、目标表名、目标列名,血缘关系R映射为:原始表名,原始列名–目标表名、目标列名,从而建立血缘关系表,当数据库操作记录不完整时,针对于每个列,提取如下特征:字符类型、平均字符长度、平均数字字符占比、平均英文字符占比、平均中文字符占比,利用人工智能算法将相似特征的列聚到一个类中,在同一类中,计算类内容的相似度,相似度的计算公式是:
其中:C,D表示两个进行比较的列,ci,di表示列的元素,n,m表示两个列的长度,若相似度超过阈值,则定义这两个列是具有数据传输关系的,将这种关系定义为血缘 关系R,补充到血缘关系表中;
步骤二,基于血缘关系R,分别对数据库进行敏感数据字段、越权操作和重要表操作审计,得到异常结果,重要表操作的审计步骤为:通过PageRank算法计算出血缘关系表的中心度,根据中心度进行排序找出重要表,最后对重要表操作用户进行审计,找出异常操作的用户。
2.根据权利要求1所述的基于血缘关系的数据库审计方法,其特征在于,所述步骤二中敏感数据字段的审计步骤为:通过客户提供的敏感数据字段和血缘关系R的字段进行关联,找到与敏感列有直接或间接血缘关系的列的结合,并把这些列定义为敏感字段群体,然后结合数据库操作日志审计敏感字段群体,找出对敏感字段群体进行异常操作的用户,分析数据传输日志和敏感字段群体,识别出对敏感数据字段进行大量导出操作的异常用户。
3.根据权利要求1或2所述的基于血缘关系的数据库审计方法,其特征在于,所述步骤二中越权操作的审计步骤为:首先定义用户的权限表,然后将用户的权限表和血缘关系表进行关联,找出进行越权访问操作的异常用户。
4.根据权利要求1所述的基于血缘关系的数据库审计方法,其特征在于,所述步骤一中的人工智能算法为kmeans算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910767801.3/1.html,转载请声明来源钻瓜专利网。