[发明专利]基于关系矩阵的工作流日志重复任务识别方法有效
申请号: | 201711165952.9 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107909344B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 俞东进;陈耀旺;潘建梁;王娇娇;侯文杰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于关系矩阵的工作流日志重复任务识别方法。本发明采用对日志事件先分类再聚类的策略,在划分过程中通过寻找具有稳定结构的循环和并行结构,减少划分种类。在聚类过程中,根据事件上下文计算候选重复任务集合中两两之间相似度,在每次聚类过程中计算模型质量,最终聚类完成后选择最优聚类方案,其中每个聚类即代表了一个真正不同的任务。采用本发明的方法识别和重命名重复任务可提高后续工作流模型挖掘的精确度。 | ||
搜索关键词: | 基于 关系 矩阵 工作流 日志 重复 任务 识别 方法 | ||
【主权项】:
基于关系矩阵的工作流日志重复任务识别方法,其特征在于该方法的具体步骤是:步骤(1).定义e为事件,E为事件集合,输入多条由事件组成的有限活动序列,每条有限活动序列即为一条轨迹T,其中可存在重复事件,多条轨迹组成原始事件日志;步骤(2).根据轨迹中事件输入顺序,得到轨迹的跟随关系,记为ei>Lei+1,再将轨迹中所有跟随关系的集合表示为关系矩阵Casual Matrix,记为CM,使用三元组<E,I,O>表示,其中:(1)E为日志的事件集合;(2)I为前驱事件集合,对于任意e1∈E,若存在e2∈I(e),则满足e2>Le1;(3)O为后继事件集合,对于任意e1∈E,若存在e2∈O(e),则满足e1>Le2;步骤(3).定义矩阵循环、矩阵并行的特征;序列<ek,…,ei,…,en>称为矩阵循环,记为MC,当且仅当:(1)存在序列Ts=<e0,…,ek,…,ei,…,en,en+1>,其中e0为开始事件,对于任意i属于[0,n ‑1],在关系矩阵中都存在ei>Lei+1;(2)Ts中除ei+1外的任务没有重复;(3)en+1与序列Ts中下标为k元素相同;序列<split,s,join>称为矩阵并行,记为MP,当且仅当:(1)I与O为活动e在关系矩阵中的前驱后继集合,且I∩O={e1,…,en};(2)S是集合{e,e1,…,en}的一个全排列,对于所有的s∈S,都存在:如果s为任意轨迹T的子序列,则在轨迹中s的前驱事件为split,s的后继事件为join;步骤(4).根据得到的关系矩阵CM和已定义的循环、并行结构的特征,在原始事件日志中获取矩阵循环和矩阵并行,以便后续分类时直接跳过此类结构;步骤(5).根据步骤(4)得到的矩阵循环、矩阵并行,并通过候选重复任务定义判断,将原始事件日志中的事件进行映射,对事件进行重命名,得到新日志;在日志中确定了属于循环结构和并行结构的事件后,进行划分类别,在关系矩阵中,对于所有事件e∈E,如果max(min(F(e),P(e)),1)>1,则e被判定为属于重复事件,与其对应的任务t被判定为重复任务,在经过矩阵循环和矩阵并行标记后的日志中,事件的重命名规则为:设Ae为事件e对应的活动集合,对于事件e∈EL,如果存在max(min(F(e),P(e)),1)>1且e没有被标记为矩阵并行和矩阵循环,则:e′∈I(e),设tag(e′)为与e′对应的活动名称,l(e)=tag(e′)∈Ae;步骤(6).计算重复任务间的相似度,按照相似度从高到低的顺序聚类得到一系列事件日志;事件日志通过挖掘算法得到模型,最终选取精确度最高的重复任务聚类方案,输出已标记重复事件的事件日志;重复任务聚类算法是先构造所有原始事件的后继关系矩阵PCM(e),即重命名事件集合β(e)中事件的后继关系的集合,设置初始最佳日志为Lp,只要存在事件e后继关系矩阵|PCM(e)|>1,计算β(e)中相似度最高的两个重命名事件e1,e2,更新日志中Lp的事件名称和后继关系矩阵PCM(emax);如果使用Lp得到的模型精确度大于使用Lbest得到的模型精确度,则Lbest=Lp;在聚类过程中,每次都将相似度最高的事件合并,即合并一个事件e的重命名集合中的两个重复事件,同时产生临时模型并计算其精确度,最终聚类得到的日志中,对于所有的e∈E都存在|β(e)|=1,即经过最后一次聚类后得到的重命名事件日志与原始事件日志相同。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711165952.9/,转载请声明来源钻瓜专利网。
- 上一篇:电子监察方法、系统及存储介质
- 下一篇:工单的处理方法及装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理