[发明专利]一种面向审计的关系数据库聚合代数约束自动挖掘方法有效
申请号: | 202010686608.X | 申请日: | 2020-07-16 |
公开(公告)号: | CN111881222B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 江大伟;陈珂;张效伟;陈刚;寿黎但;伍赛;胡天磊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 审计 关系 数据库 聚合 代数 约束 自动 挖掘 方法 | ||
1.一种面向审计的关系数据库聚合代数约束自动挖掘方法,其特征在于,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用于D中部分记录上的八元组:
其中,a1、a2是D中的两个属性字段,来自同一张数据表或来自两张不同的数据表;f1、f2是分别施加在属性a1、a2上的聚合函数,所述聚合函数选自Count、Sum、Avg、Max和Min;二元运算符是f1(a1)和f2(a2)间的代数运算符,包括+、-、×和/;I=Ii∪…∪Ij为的值域集合,其中Ii∈I是一个实数闭区间[a,b],且I中任意两个区间Ii、Ij满足如果a1、a2来自不同数据表,配对规则p指定数据表间的连接条件;g是分组规则,语义上等同于SQL的Group By语句,指定与聚合运算相关的分组字段列;定义形式化地表明聚合代数约束是a1、a2在条件p、g下,使用函数f1、f2进行运算后产生的值域集合I约束;
该方法包括以下步骤:
(1)获取数据库的模式信息:根据给定的关系数据库D,获取数据库中所有定义信息;
(2)根据模式信息自动产生描述数据库表连接的配对规则p:产生关系数据库D内所有的表连接关系,形成配对规则p;
(3)根据模式信息和配对规则p自动产生数据统计查询所依赖的分组规则g:对按配对规则连接形成的结果表进行分析,将具有类别属性的字段组合成分组规则g;
(4)根据模式信息、配对规则p和分组规则g自动产生描述聚合代数约束中运算部分的代数表达式:在配对规则p描述的连接运算结果中,首先寻找可进行代数运算的字段作为ai;接着生成聚合函数fi,组合形成fi(ai);最后枚举运算符组合成代数表达式将配对规则p、分组规则g和代数表达式组成候选聚合代数约束c;
(5)计算代数表达式:根据候选聚合代数约束c形成语义等同的计算策略,执行计算后获得运算结果;
(6)分析代数表达式值域集合,产生聚合代数约束作为审计规则:分析代数表达式的结果,产生合适的区间作为值域集合,与对应的候选聚合代数约束c组合形成结果聚合代数约束aac;该聚合代数约束aac即为审计规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010686608.X/1.html,转载请声明来源钻瓜专利网。