[发明专利]一种基于重演技术的业务流程上下文提取方法有效
申请号: | 202010705097.1 | 申请日: | 2020-07-21 |
公开(公告)号: | CN112052232B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 孙笑笑;侯文杰;俞东进 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/23;G06F16/9537;G06Q10/10 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 重演 技术 业务流程 上下文 提取 方法 | ||
1.一种基于重演技术的业务流程上下文提取方法,其特征在于包括以下步骤:
S1.数据预处理:输入原始日志,使用过程发现技术从中挖掘出Petri网流程模型PN;
S2.行为上下文提取:利用重演技术基于步骤S1获得的Petri网流程模型PN对当前轨迹进行重演,具体包含S21~S28步骤:
S21.从PN中获取开始活动集合结束活动集合以及PN中的全部活动集合并初始化全局行为上下文向量vgbc为长度的0向量,其中为PN中库所节点的数量;
S22.对日志中的事件根据其发生时间先后进行排序,得到按发生早晚排好序的事件集Elist;
S23.依次遍历Elist中的每个事件并根据事件的实例ID属性找到其所属的轨迹T;
S24.对Elist中的每个事件e,按照S25~S28判断其执行活动a的类型,返回更新的事件集E′list,E′list中的每个事件均包含全局行为上下文属性e.gbc和局部行为上下文属性e.lbc;
S25.若a属于开始活动集为开始活动,则执行以下操作:
(1)初始化当前活动的局部行为上下文向量vlbc为长度的0向量;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost;
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置的数值加1,对vgbc执行相同的操作,然后将vlbc存储到当前事件e的局部行为上下文属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的全局行为上下文属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到当前轨迹T执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S26.若a不属于但属于为普通活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost;
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置处的数值减1,然后将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到轨迹执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S27.若a不属于则当前执行的活动在PN模型中未出现过,为意外活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(3)对vlbc中位置上的数值加1来表示该活动执行后的状态,然后将vlbc存储到当前轨迹T的属性T.nextState中;
S28.若当前事件执行的活动属于结束活动集则说明当前轨迹执行完毕,则执行以下步骤:
(1)从全局上下文vgbc中减去当前轨迹带来的托肯,即vgbc=vgbc-T.lastState:
(2)局部行为上下文向量vlbc仍为T.nexState,将vlbc存储到当前事件e的属性e.lbc,将vgbc存储到当前事件e的属性e.gbc中;
S3.时间上下文提取:对事件集E′list中的每个事件发生的时间戳进行处理,得到每个事件当前执行活动的时间上下文e.tcv=[h,m,d,weekday,tsct,td],其中h,m,d,weekday分别表示该时间戳对应的小时、月份、天以及星期的信息,tsct表示当前时间戳距实例开始时间戳的时间间隔,td表示当前时间戳距当天0点的时间间隔;
S4.属性上下文提取:对事件的其余属性根据其属性值是否为数值类型划分为类别属性和数值属性,对类别属性进行编码,然后与数值属性构成的向量合并得到属性上下文e.dcv;
S5.完整上下文计算:对事件日志中的每个事件,使用S2中获得的属性e.lbc和属性e.gbc、S3中获得的属性e.tcv以及S4中获得的属性e.dcv进行级联,得到事件对应的完整上下文信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010705097.1/1.html,转载请声明来源钻瓜专利网。