[发明专利]基于关系矩阵的工作流日志重复任务识别方法有效
申请号: | 201711165952.9 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107909344B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 俞东进;陈耀旺;潘建梁;王娇娇;侯文杰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关系 矩阵 工作流 日志 重复 任务 识别 方法 | ||
本发明公开了一种基于关系矩阵的工作流日志重复任务识别方法。本发明采用对日志事件先分类再聚类的策略,在划分过程中通过寻找具有稳定结构的循环和并行结构,减少划分种类。在聚类过程中,根据事件上下文计算候选重复任务集合中两两之间相似度,在每次聚类过程中计算模型质量,最终聚类完成后选择最优聚类方案,其中每个聚类即代表了一个真正不同的任务。采用本发明的方法识别和重命名重复任务可提高后续工作流模型挖掘的精确度。
技术领域
本发明属于数据挖据技术领域,具体涉及到一种基于关系矩阵的工作流日志重复任务识别方法。
背景技术
随着智能制造和业务流程管理的广泛应用,工作流技术在最近的几十年得到了迅猛的发展,并正不断地向智能化、柔性化等方向演进。工作流技术将日常生活中的流程抽象化成流程模型,将工作分解成一个个任务并分配给不同角色,按照既定流程执行和监管,其应用目的是提高工作效率。工作流模型挖掘是通过分析信息系统中的运行日志提取出流程模型,其相对于人工设计的流程模型更具有客观性,可为企业发现、监控和改进真实的业务流程带来重大意义。
在流程建模过程中,建模者会为不同的任务节点分配相同的活动名称来表示同一活动在流程不同阶段的执行,而在运行日志中记录轨迹的事件名称通常由活动名称决定而不是任务名称,导致存在重复任务的情况下无法确定轨迹中出现的同名事件(重复事件)代表同一任务还是不同任务。例如图1(a)所示,某医院看病诊疗流程的原始模型,其中包含多次诊断操作c、验血操作b和X光检测操作x,如果直接基于这些原始日志挖掘得到的模型,例如图1(b),可能会因为活动名称重复导致挖掘出原诊疗流程中不存在且毫无意义的轨迹,无法还原真实的诊疗流程。
然而,现有大多数工作流模型挖掘算法的前提假设是运行日志中记录的事件和模型中的任务是一一对应的。使用这些算法对含有重复任务的运行日志进行流程挖掘时,得到的流程模型往往存在过多连接的节点和没有意义的循环结构,导致模型还原精确度降低。
发明内容
本发明针对现有技术的不足,提供了一种基于关系矩阵的工作流日志重复任务识别方法。
本发明方法的具体步骤是:
步骤(1).定义e为事件,E为事件集合,输入多条由事件组成的有限活动序列,每条有限活动序列即为一条轨迹T,其中存在重复事件,多条轨迹组成原始事件日志L。
步骤(2).根据轨迹中事件的输入顺序,得到轨迹的跟随关系,如ei+1跟随ei, 记为eiL ei+1,再将轨迹中所有跟随关系的集合表示为关系矩阵Casual Matrix,记为CM,可使用三元组E,I,O表示。
步骤(3).定义矩阵循环、矩阵并行的特征。
步骤(4).根据得到的关系矩阵CM和已定义的循环、并行结构的特征,在原始事件日志中获取矩阵循环和矩阵并行,以便后续分类时直接跳过此类结构。
步骤(5).根据步骤(4)得到的矩阵循环、矩阵并行,并通过候选重复任务定义判断,将原始事件日志中的事件进行映射,对事件进行重命名,得到新日志。
步骤(6).计算重复任务间的相似度,按照相似度从高到低的顺序聚类得到一系列事件日志;事件日志通过挖掘算法得到模型,最终选取精确度最高的重复任务聚类方案,输出已标记重复事件的事件日志,例如图1(c),识别重复任务, 并作出区别标记,以达到流程挖掘的精确度。
本发明所提供的基于关系矩阵的工作流日志重复任务识别方法由一组模块组成,它们包括:标记特殊结构事件模块、日志事件划分模块、日志事件聚集模块。
标记特殊结构事件模块是在原始事件日志中通过分析事件日志行为特征,标记出日志中由循环和并行结构产生的事件序列段,这些标记出的事件不参与之后的事件划分操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711165952.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子监察方法、系统及存储介质
- 下一篇:工单的处理方法及装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理