[发明专利]一种面向审计的关系数据库聚合代数约束自动挖掘方法有效

专利信息
申请号: 202010686608.X 申请日: 2020-07-16
公开(公告)号: CN111881222B 公开(公告)日: 2022-04-12
发明(设计)人: 江大伟;陈珂;张效伟;陈刚;寿黎但;伍赛;胡天磊 申请(专利权)人: 浙江大学
主分类号: G06F16/28 分类号: G06F16/28;G06F16/2458
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 审计 关系 数据库 聚合 代数 约束 自动 挖掘 方法
【说明书】:

发明公开了一种面向审计的关系数据库聚合代数约束自动挖掘方法,它是一种智慧审计应用中潜藏于海量数据之中的约束关系挖掘方法。现有的审计规则或由专家构造,或由数据库约束发现方法产生,能实现审计简单业务的目的,但是不足以应付海量数据规模挑战,无法满足审计作业中含统计数值的复杂运算的需求。本发明针对上述不足,将该需求形式化成聚合代数约束,并提供聚合代数约束的挖掘方法,该方法根据数据库的模式信息依次枚举表连接、分组方式和代数表达式,计算分析后得到聚合代数约束。本发明无需人工参与约束挖掘,可以应对计算海量数据带来的时空性能挑战,满足审计统计数值相关的复杂运算需求。

技术领域

本发明涉及智慧审计应用中的审计规则挖掘领域,尤其涉及一种面向审计的关系数据库 聚合代数约束自动挖掘方法。

背景技术

在现实生活的审计作业中,审计员根据审计实务指南和专家经验开展审计工作。通常, 审计过程能否顺利实施的关键在于审计员能否根据业务规则发现对应数据表中存在的模糊约 束,即作用于数据表中的大多数而非全部记录之间的约束,这些约束即可作为审计规则,在 审计工作中发挥重要作用。例如,“约束c1:Sum(收入)=Sum(支出)”和“约束c2:交通费+ 住宿费<1000”是较为简单的模糊约束,可以由审计员凭借专家经验给出,然后将其作为审 计规则逐一检查数据记录是否违例。然而,审计员很难发现潜藏着的复杂约束,如“约束 c3:Avg(住宿费)+Avg(杂费)∈[1000,2000]∪[3000,5000]Group By部门”表明按照部门字 段对报销记录进行分组,大多数部门的平均住宿费和平均杂费之和在特定的区间[1000,2000] 以及[3000,5000]之内。审计员之所以难以通过专家经验给出类似约束c3的模糊约束,是因为 它们涉及了数据的统计数值情况,与数据分布情况密切相关。如果需要审计含统计数值的复 杂运算的数据,当下并没有一套行之有效的方法可以满足这些需求,如何提升执行这些审计 任务的效率更是无从说起。

在大数据时代,随着数据体量越来越大,审计工作的实施成本越来越高昂,现有的方法 也逐渐无法满足时代的需求。因此,是时候该由传统的以专家经验为主的审计工作,逐渐转 向以数据驱动为主的智慧审计了。使用数据驱动的方式进行审计工作,可以充分利用数据自 身的特性发现审计规则、构造审计方案,利用计算机强大的计算能力自动完成审计作业,利 用人工智能等新方法提高工作效率。研究者已经发明了一系列从数据库中发现不同类型约束 的技术,包括函数约束、否定约束、模式约束和代数约束等。如上述举例的约束c2即为代数 约束,可以由代数约束发现技术给出。然而,已有的约束定义和发现技术仅涉及约束发现问 题中极小部分的情况,更多的复杂约束需要被准确定义并设计方法从数据库中寻找出。例如, 上述举例的约束c3包含了聚合函数和代数运算,反映了在一定条件下数据的统计信息和代数 运算所满足的约束,在本发明前这类约束尚未被明确定义且无有效的发现方法。

现有的技术方法还未能够完全满足实现数据驱动的审计需求,其原因可能在于:1)审计 规则种类复杂繁多,只使用一套方法难以应付业务变化无穷带来的审计需求多样化;2)数据 驱动式方法带来的庞大计算空间的缺陷,其可能导致运算的中间结果规模巨大,且随着原始 数据的增长而爆炸式增长;3)庞大的计算规模加上高昂的计算代价,使得无法在有意义的时 间内完成审计工作。

发明内容

本发明的目的在于针对现有技术的不足,提供了一种面向审计的关系数据库聚合代数约 束自动挖掘方法。本发明挖掘潜藏在关系数据库海量数据中的聚合代数约束,将聚合代数约 束作为审计规则应用于智慧审计中,无需人工参与约束挖掘,可以应对计算海量数据带来的 时空性能挑战,满足审计统计数值相关的复杂运算需求。。

本发明的目的是通过以下技术方案来实现的:一种面向审计的关系数据库聚合代数约束 自动挖掘方法,所述聚合代数约束定义如下:给定关系数据库D,聚合代数约束是一个作用 于D中部分记录上的八元组:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010686608.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top