[发明专利]一种基于事件日志的可配置流程挖掘方法及系统有效
申请号: | 202011566625.6 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112579574B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 曹健;冯英瑞 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/22;G06F16/2458;G06Q10/10 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 事件 日志 配置 流程 挖掘 方法 系统 | ||
1.一种基于事件日志的可配置流程挖掘方法,其特征在于,所述可配置流程包括流程模型和ECA规则两部分,该方法包括:
步骤1:从标准XES格式的事件日志中挖掘出一个流程树;
步骤2:根据事件日志计算流程树中各个节点的执行频率;
步骤3:对执行频率低于预设值的节点进行裁剪,并将被裁剪活动转化为ECA规则;
步骤4:把裁剪后的流程树转化为普通的流程模型;
所述流程模型和ECA规则包括:
流程模型:定义流程执行的主要逻辑;
ECA规则:包括事件、条件和动作,用于修改流程模型并形成新的流程变体;
记|xLy|为在日志L中活动y直接跟在活动x之后的次数,·t为活动t的前驱活动集,t·为活动t的后继活动集,
对于普通活动t,其执行频率为∑x∈·t|xLt|;
对于空活动τ,其执行频率为∑(x,y)∈·t×t·|xLy|;
对于顺序节点,其执行频率为该节点第一个子节点的执行频率;
对于选择节点,其执行频率为该节点所有子节点的执行频率之和;
对于并行节点,其执行频率为该节点所有子节点的执行频率的最大值,同时为每个子节点过滤掉日志中其他子节点中的活动;
对于循环节点,其执行频率为该节点的do子节点的执行频率;
所述步骤3中执行频率低于预设值节点的判断方法包括:
对于选择节点,将满足式的子节点判定为执行频率低于预设值的节点;
其中,freqc为子节点的执行频率,n为子节点总数,freq×为×节点的执行频率,threshold为阈值;
对于循环节点,将满足式的redo子节点判定为执行频率低于预设值的节点;
其中,freqredo为redo子节点的执行频率,freqdo为do子节点的执行频率,threshold为阈值;
所述步骤3中将被裁剪掉活动转化为ECA规则包括:
对于事件,遍历事件日志,找出被裁剪活动发生时一定发生的事件,若不存在这样的事件,取“start”,即流程开始时的事件;
对于条件,把活动出现与否作为分类类别,以被裁剪活动之前的活动为输入,被裁剪活动为输出,构建决策树;那么,从树的根到代表被裁剪活动发生的叶子节点的路径转化为一个符号表达式,作为ECA规则的条件;
对于动作,操作和目标分别为添加和活动;在×节点中,若裁剪后仅剩下唯一的分支c,该×节点将被移除,动作的位置为Xor(c);否则,动作的位置为In(×);在节点中,裁剪redo分支后,节点被移除,动作的位置为Loop(do)。
2.一种基于事件日志的可配置流程挖掘系统,其特征在于,所述系统包括:
模块1:从标准XES格式的事件日志中挖掘出一个流程树;
模块2:根据事件日志计算流程树中各个节点的执行频率;
模块3:对执行频率低于预设值的节点进行裁剪,并将被裁剪活动转化为ECA规则;
模块4:把裁剪后的流程树转化为普通的流程模型;
所述流程模型和ECA规则包括:
流程模型:定义流程执行的主要逻辑;
ECA规则:包括事件、条件和动作,用于修改流程模型并形成新的流程变体;
所述模块2包括:
记|xLy|为在日志L中活动y直接跟在活动x之后的次数,·t为活动t的前驱活动集,t·为活动t的后继活动集,
对于普通活动t,其执行频率为∑x∈·t|xLt|;
对于空活动τ,其执行频率为∑(x,y)∈·t×t·|xLy|;
对于顺序节点,其执行频率为该节点第一个子节点的执行频率;
对于选择节点,其执行频率为该节点所有子节点的执行频率之和;
对于并行节点,其执行频率为该节点所有子节点的执行频率的最大值,同时为每个子节点过滤掉日志中其他子节点中的活动;
对于循环节点,其执行频率为该节点的do子节点的执行频率;
所述模块3中执行频率低于预设值节点的判断方法包括:
对于选择节点,将满足式的子节点判定为执行频率低于预设值的节点;
其中,freqc为子节点的执行频率,n为子节点总数,freq×为×节点的执行频率,threshold为阈值;
对于循环节点,将满足式的redo子节点判定为执行频率低于预设值的节点;
其中,freqredo为redo子节点的执行频率,freqdo为do子节点的执行频率,threshold为阈值;
所述模块3中将被裁剪活动转化为ECA规则包括:
对于事件,遍历事件日志,找出被裁剪活动发生时一定发生的事件,若不存在这样的事件,取“start”,即流程开始时的事件;
对于条件,把活动出现与否作为分类类别,以被裁剪活动之前的活动为输入,被裁剪活动为输出,构建决策树;那么,从树的根到代表被裁剪活动发生的叶子节点的路径转化为一个符号表达式,作为ECA规则的条件;
对于动作,操作和目标分别为添加和活动;在×节点中,若裁剪后仅剩下唯一的分支c,该×节点将被移除,动作的位置为Xor(c);否则,动作的位置为In(×);在节点中,裁剪redo分支后,节点被移除,动作的位置为Loop(do)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011566625.6/1.html,转载请声明来源钻瓜专利网。