[发明专利]一种自由单循环结构的过程挖掘方法在审
申请号: | 201710635987.8 | 申请日: | 2017-07-31 |
公开(公告)号: | CN107391715A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 杜玉越;贺朝阳;王路;张福新;李鹏;刘伟 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06;G06Q10/00 |
代理公司: | 青岛智地领创专利代理有限公司37252 | 代理人: | 陈海滨 |
地址: | 266590 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自由 单循环 结构 过程 挖掘 方法 | ||
技术领域
本发明涉及一种自由单循环结构的过程挖掘方法。
背景技术
过程挖掘在数据挖掘和过程建模与分析两个领域的知识之间搭建桥梁,从事件日志中提取知识,进而发现、监控和改进实际过程。有三种类型过程挖掘的场景使用了事件日志,分别为过程发现、一致性检测和过程增强。过程发现是使用不包含先验信息的日志挖掘得到模型;一致性检测是比较日志实际情况和挖掘的过程模型是否吻合,或者比较已知模型与其产生的日志的情况是否吻合;过程增强是对于一个已存在的过程,利用实际过程产生的日志对其进行改进或扩展。在过程挖掘中,日志的完备性是至关重要的。完备性与噪声类似,不同的是噪声表示日志中含有过多数据而完备性表示日志中含有的数据过少这一问题。缺少特殊的日志行为的非完备的事件日志将会对挖掘算法的实际工作产生影响,导致无法挖掘正确的模型。噪声和不完备性描述的是关于事件日志的质量的问题,而关于模型质量的度量并不能简单的判断,需要从不同的维度来描述。过程模型有拟合度、精确度、泛化度和简洁度这四个主要的度量维度。模型的拟合度表示事件日志中的迹在过程模型中的重演能力,拟合度高的模型说明其允许事件日志中所反映的行为发生。模型的精确度决定模型是否允许日志以外的行为出现,模型的精确度高说明其不允许过多日志以外的行为发生。模型的泛化度代表模型不仅仅局限于日志中的行为,允许更多额外的行为。简洁度好的模型说明是能够解释日志中所见行为并且最简单的模型。目前,国内外学者提出了许多过程挖掘算法,例如:
文献1(VAN DER AALST W,WEIJTERS T,MARUSTER L.Workflow mining:Discovering process models from event logs[J].IEEE Transactions on Knowledge and Data Engineering,2004,16(9):1128-1142)提出了挖掘工作流模型的α算法并证明了能准确挖掘出的模型种类。从实践日志中挖掘过程模型时,很多实际的业务流程对应的工作流模型中存在复杂结构,如非自由选择结构(non-free-choices)、不可见任务(invisible tasks)、重名任务(duplicate tasks)以及长短不一的循环结构(loop)。α算法通过分析日志中活动之间的依赖关系实现模型的挖掘工作。这些依赖关系的定义基于局部日志行为,对于短循环和非自由选择结构等复杂结构无法处理。文献2(DE MEDEIROS A,VAN DER AALST W,WEIJTERS T.Workflow Mining:Current Status and Future Directions[J].Lecture Notes in Computer Science,2003,2888(9):389--406)提出的α+算法扩展了α算法,针对长度为1和2的短循环进行挖掘。文献3(WEN L,VAN DER AALST W,WANG J,et al.Mining process models with non-free-choice constructs[J].Data Mining and Knowledge Discovery,2007,15(2):145-180)在此基础上提出了能够处理非自由选择结构的α++算法。文献4([闻立杰.基于工作流网的过程挖掘算法研究[D].北京:清华大学,2007)利用任务执行需要时间提出了β算法,用于解决短循环和多并发复杂分支等情况。文献5(顾春琴,常会友,陶乾等.可解决多种复杂任务的过程挖掘算法[J].计算机集成制造系统,2009,15(11):2193-2198)利用启发式规则发现日志中的循环任务和重复任务,提出了τ算法。文献6(VAN DER AALST W,DE MEDEIROS A,WEIJTERS A.Genetic process mining[C]//International Conference on Application and Theory of Petri Nets.Springer Berlin Heidelberg,2005:48-69)和文献7(DE MEDEIROS A,WEIJTERS A,VAN DER AALST W.Genetic process mining:an experimental evaluation[J].Data Mining and Knowledge Discovery,2007,14(2):245-304)将遗传算法应用于过程挖掘,解决了非自由选择结构、不可见任务以及重名任务等复杂结构的挖掘问题。基于语言的区域挖掘、基于状态的区域挖掘以及ILP挖掘算法对模型的拟合度有很好的保证。文献8(LEEMANS S,FAHLAND D,VAN DER AALST W.Discovering block-structured process models from event logs-a constructive approach[C]//International Conference on Applications and Theory of Petri Nets and Concurrency.Springer Berlin Heidelberg,2013:311-329)针对块状结构过程模型的挖掘提出了IM算法,挖掘得到的模型具有极高的拟合度。在不考虑重名活动的情况下,对于存在循环结构的事件日志,一定存在重复出现次数大于2的活动;对于α系列算法,当循环结构与其他的结构处于平行关系的不同支路时,定义的活动间的依赖关系存在局限;对于日志中的同一循环结构中的活动没有连续出现时,α系列算法将不能正确的发现嵌套在平行结构中的循环结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710635987.8/2.html,转载请声明来源钻瓜专利网。