[发明专利]基于混合型事件日志的容噪过程挖掘方法有效
申请号: | 201910761362.5 | 申请日: | 2019-08-18 |
公开(公告)号: | CN110597686B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 宋巍;尚庆民;戴汪洋;肖芳雄 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 事件 日志 过程 挖掘 方法 | ||
1.一种基于混合型事件日志的容噪过程挖掘方法,其特征在于,用于挖掘混合型事件日志对应的过程模型,以可能含噪声的、既有点事件又有区间事件的混合型事件日志为输入,以挖掘出所得过程模型为输出结果,该方法包括以下步骤:
步骤1,基于事件序列挖掘序列级事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的序列级事件关系,包括直接先于关系、相交关系、相离关系和共同存在关系;
混合型事件序列σ=e1 e2 e3…en包含n个事件,e1…en表示n个事件,其中ei=x表示事件ei是点事件x,ej=ys表示事件ej是区间事件y的开始事件,ej=ye表示ej是区间事件y的结束事件,求序列级事件关系的具体过程如下:
步骤1-1,解析混合型事件日志,获取日志中所有的事件序列的集合,所述事件序列的集合是指日志中事件可能发生的先后顺序的排序组合;
步骤1-2,扫描集合中的每一条序列,获得每条序列中事件间的关系;对于任意一条混合型事件序列σ=e1 e2 e3…en,其中包含两个事件x1和y1,根据事件发生的先后顺序,求解x1和y1之间的关系,具体包括:
(1)直接先于关系,符号表示为:当序列内两个事件ei和ej同时满足以下四个条件:①ei=x或ei=xe;②ej=y或ej=ys;③不存在p,i<p<j,ep=z;④不存在k,l,i<k<l<j,ek=zs,el=ze;则x1>y1;
(2)相交关系,符号表示为︱:当序列内几个事件ei,ej,ep,eq满足以下两个条件中的任意一个:①ei=xs,ej=xe,ep=ys,eq=ye,且p<i<q或i<p<j;②ei=ys,ej=ye,ek=x1,且i<k<j;则x1︱y1,y1︱x1;
(3)相离关系,符号表示为若日志中两个事件x1和y1,满足x1≯y1,y1≯x1,且则
(4)共同存在关系,符号表示为若两个事件x1和y1出现在同一条事件序列,则
步骤2,推导基于事件日志的日志层事件关系,利用序列级事件关系及出现的频数,结合Tukey’s fences,并创建启发式规则,从而推导出日志层面的事件关系,包括因果关系、交织关系和独立关系;具体包括以下步骤:
步骤2-1,用|L|表示事件日志L包含的事件序列数量,用表示x2和y2的共同存在频数,对集合采用Tukey’s fences,检测集合Sco中的异常值,令异常值对应的两个事件x2和y2的其中,Tukey’s fences检测异常值的方式如下:
对于一组数据构成的集合,Q1表示集合中下四分位数,Q3表示集合中上四分位数,IOR=(Q3-Q1)表示集合的四分位距,将集合中小于Q1-1.5IQR和大于Q3+1.5IQR的数值识别为异常值;
步骤2-2,日志层面的事件关系包括因果关系、交织关系和独立关系;用|x2>y2|、|x2|y2|和分别表示关系x2y2、x2︱y2和出现的频数,推导日志层面的事件关系所采用的启发式规则如下:
启发式规则1:假设x2,y2∈T,若则称x2和y2是因果关系,符号表示为x2→y2;若且则称x2和y2是交织关系,符号表示为x2||y2;若则称x2和y2是独立关系,符号表示为x2#y2;
启发式规则2:根据“所有活动相连接”的规则,每一个不是开始节点的活动都应该有其他活动作为其前驱活动,每一个不是结束节点的活动都应该有其他活动作为其后继活动;假设非开始节点的活动y2缺少前驱活动,则从与y2构成直接先于关系的所有活动x2中,选择|x2>y2|的值最大的,且作为y2的前驱,即x2和y2关系为x2→y2;假设非结束节点的活动a缺少后继活动,则从与a构成直接先于关系的所有活动b中,选择|a>b|的值最大的,且作为a的后继活动,即a和b关系为a→b;
步骤3,获取过程模型,调用α算法中基于日志层事件关系的模型生成算法,获得最终的过程模型。
2.根据权利要求1所述的基于混合型事件日志的容噪过程挖掘方法,其特征在于:步骤3中,根据步骤2求得的日志层事件关系,调用α算法基于日志层事件关系的模型生成算法,获取最终模型中变迁之间的关系,并在变迁间添加库所,产生最终的Petri网模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910761362.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器系统日志Log文件收集工具及方法
- 下一篇:一种日志处理方法和装置