[发明专利]一种基于主题聚类的业务流程图合并方法有效
申请号: | 201510815713.8 | 申请日: | 2015-11-23 |
公开(公告)号: | CN105468371B | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 黄颖;李伟;何显文;赖宏慧 | 申请(专利权)人: | 赣南师范学院 |
主分类号: | G06F8/20 | 分类号: | G06F8/20 |
代理公司: | 赣州凌云专利事务所 36116 | 代理人: | 曾上 |
地址: | 341000 江西省*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 业务 流程图 合并 方法 | ||
1.一种基于主题聚类的业务流程图合并方法,其特征是:包括以下步骤:
步骤1,将流程库中的业务流程视为文档,对流程文档进行预处理;
步骤2,使用CTM对步骤1所得的流程文档进行主题聚类;
步骤3,使用高效频繁子图查找算法,结合频繁子图的定义得到频繁流程子图;
步骤4,根据步骤3所得结果,对频繁流程子图进行合并,从而得到合并后的业务流程;
所述的步骤3包括以下子步骤:
步骤3.1,针对步骤2主题聚类后的流程,将原始业务流程转换为流程结构图;
步骤3.2,使用gSpan算法挖掘同一主题下业务流程子图;
步骤3.3,发现业务流程子图集合内的频繁流程子图即频繁流程片段集合。
2.根据权利要求1所述的一种基于主题聚类的业务流程图合并方法,其特征是:步骤1包括以下子步骤:
步骤1.1,对流程文档进行解析,抽取文档中的所有单词;
步骤1.2,根据单词的词性,将除动词和名词之外的词过滤掉;
步骤1.3,对步骤1.2的结果进行关键词词干化处理,即除去词的前后缀,得到词的原型。
3.根据权利要求1所述的一种基于主题聚类的业务流程图合并方法,其特征是:步骤2包括以下子步骤:
步骤2.1,使用基于逻辑正态分布logistic normal distribution的CTM方法得到每个业务流程文档与其所包含的潜在主题的概率分布;
步骤2.2,找到这个业务流程所包含的主题概率的最大值,将其聚类到该主题对应的主题类簇中;
步骤2.3,重复步骤2.2,直到将特定领域内所有流程文档聚类到T个主题类簇中。
4.根据权利要求1所述的一种基于主题聚类的业务流程图合并方法,其特征是:所述步骤4包括以下子步骤,
步骤4.1,两个业务流程结构图G1、G2,查找G1、G2能够合并的边,剔除G2中与G1相同的边;
步骤4.2,对合并流程结构图MG中的每条共同边用G1、G2的标签标注;
步骤4.3,对G1、G2的频繁流程子图的前驱节点通过添加异或“xor”连接点连接频繁流程子图,同时添加连接的边;
步骤4.4,对G1、G2的频繁流程子图的后继节点通过添加异或“xor”连接点连接频繁流程子图,同时添加连接的边;
步骤4.5,合并频繁流程子图中的连接点。
5.根据权利要求1所述的一种基于主题聚类的业务流程图合并方法,其特征是:所述步骤3.1,将流程图转换为流程结构图的具体方法如下:
业务流程图是一个三元组(V,τ,Ω),其中τ为类型集合,Ω为节点文本集合;流程结构图Process Structure Graph简称PSG,PSG=(τ,L,f),τ为类型集合,L为节点标签集合,满射函数f:Ω→L,使得流程当中的节点文本有唯一与之对应的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赣南师范学院,未经赣南师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510815713.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电能表罩壳
- 下一篇:用在电能表背光片上的保护装置