[发明专利]一种基于异构流程数据的优质流程树模型生成方法和系统在审
申请号: | 202111218651.4 | 申请日: | 2021-10-20 |
公开(公告)号: | CN113947373A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 王亮;李进峰 | 申请(专利权)人: | 上海望繁信科技有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06N20/00 |
代理公司: | 北京喆翙知识产权代理有限公司 11616 | 代理人: | 曹利华 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 流程 数据 优质 模型 生成 方法 系统 | ||
本发明公开了一种基于异构流程数据的优质流程树模型生成方法和系统,所述流程树模型生成方法包括以下步骤:步骤一:子流程数据生成,步骤二:子流程模型生成,步骤三:对优质子流程模型进行筛选,步骤四:抽取流程树中流程组件及流程组件特殊度设定,步骤五:基于优质流程组件拼接完整流程,最终建立全新的流程树,所述优质流程树模型生成系统,包括:子流程数据生成引擎,子流程模型生成引擎,优质子流程筛选引擎,抽取流程树中流程组件及流程组件的特殊度引擎,基于优质流程组件拼接完整流程的引擎。该基于异构流程数据的优质流程树模型生成方法和系统,面向流程数据中有多类型形式的流程数据,可以挖掘出优质的模型。
技术领域
本发明涉及流程树模型生成技术领域,具体为一种基于异构流程数据的优质流程树模型生成方法和系统。
背景技术
流程挖掘:英文名Process Mining,是一种通过IT系统中的任务日志,建立一个基于真实数据的流程模型,提高商业流程透明度的,为商业决断者提供帮助的技术。在真实的制造业业务中,同样的流程在不同的部门(或子公司)展现的完全不一样;
如说明书俯图2和图3中用现有的流程挖掘算法,包括alpha算法,归纳挖掘算法,决策树挖掘算法(在当前主流流程挖掘工具ProM6.5中提供的算法),不能在不同类型流程的数据中建立有效的业务流程模型,流程数据中有多类型形式的流程数据;传统流程挖掘算法在多类型形式的流程数据上的流程模型效果很差(即在行业公认上指标:适应性,泛化性,简易性和精确性上表现的不好);传统流程挖掘算法可以有效的为单一类型形式的数据中建立流程模型,但不能够对所有流程进行组合建立;
因此,我们提出一种基于异构流程数据的优质流程树模型生成方法和系统,以便于解决上述中提出的问题。
发明内容
本发明的目的在于提供一种基于异构流程数据的优质流程树模型生成方法和系统,以解决上述背景技术提出的目前传统流程挖掘算法在多类型形式的流程数据上的流程模型效果很差;传统流程挖掘算法可以有效的为单一类型形式的数据中建立流程模型的问题。
为实现上述目的,本发明提供如下技术方案:一种基于异构流程数据的优质流程树模型生成方法,所述流程树模型生成方法包括以下步骤:
步骤一:子流程数据生成,通过向子流程数据生成引擎输入多类型流程的全量数据,在全量的流程数据上的基础上,利用聚类算法,以挖掘并输出n个子流程的日志数据;
步骤二:子流程模型生成,为每个子流程数据上生成一个单一的子流程模型;
步骤三:对优质子流程模型进行筛选,过滤出优质的子流程模型;
步骤四:抽取流程树中流程组件及流程组件特殊度设定,将流程模型转成流程树的格式,抽取流程树中的节点关系,且每种关系构成一个流程组件,对流程组件的特殊度进行设定;
步骤五:基于优质流程组件拼接完整流程,选择最小化的目标函数的流程组件进行流程树的建立,将所有抽取出来的流程组件进行迭代组合,最终建立全新的流程树。
优选的,所述步骤一中聚类算法为Kmeans均值偏移聚类算法和DBSCAN聚类算法的一种。
优选的,所述步骤二中子流程模型生成具体方法为:将步骤一种n个子流程的日志数据输入子流程模型生成引擎,通过流程挖掘算法挖掘建立模型,输出m个子流程模型。
优选的,所述步骤三中对优质子流程模型进行筛选过程中,首先输入m个流程模型和每个流程模型的计算指标以及对计算指标的人工设定的阈值,通过计算得分,输出x个优质的子流程模型,其中计算得分高于人工设定的阈值则认为是优质的子流程模型。
优选的,所述流程模型的计算指标包括:适应性,泛化性,简易性,精准性。
优选的,所述步骤四中节点关系包括顺序组合、独占组合、重复环、并行组合四种节点关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海望繁信科技有限公司,未经上海望繁信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111218651.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合材料数值模拟方法及装置
- 下一篇:一种基于因果并发网的流程挖掘系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置