[发明专利]基于事件直接先于关系的云间科学工作流挖掘方法有效
申请号: | 201610698348.1 | 申请日: | 2016-08-21 |
公开(公告)号: | CN106327153B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 宋巍;陈芳菲;夏小旭;张成震;李贞 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10 |
代理公司: | 32203 南京理工大学专利中心 | 代理人: | 陈鹏;朱显国<国际申请>=<国际公布>= |
地址: | 210094江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工作流 挖掘 单平台 工作流过程 工作流挖掘 云计算平台 格式描述 工作流图 基于事件 时间成本 事件日志 事件序列 输出结果 数据挖掘 消息日志 内科学 完备性 云平台 解析 集合 合并 节约 | ||
本发明公开了一种基于事件直接先于关系的云间科学工作流挖掘方法,以XES格式描述的事件日志为输入,以SVG为格式的科学工作流为输出结果,首先,解析XES文件,生成对应的事件序列集合,完成云内科学工作流的挖掘;然后,根据各个云计算平台的消息日志,完成跨云间科学工作流的挖掘;最后,对于整个云平台联盟下的总体科学工作流进行整理、合并、简化,从而得到跨云间的科学工作流。本发明挖掘的工作流图更具有完备性、准确性、可靠性,更接近实际的科学工作流过程,并且与以往单平台下的挖掘相比,大大节约了时间成本,减轻了单平台数据挖掘的负担。
技术领域
本发明属于数据挖掘领域,具体涉及一种基于事件直接先于关系的云间科学工作流挖掘方法。
背景技术
近些年,科学工作流管理的概念被应用到许多企业信息系统中。类似于Staffware,IBM MQSeries,COSA等的工作流管理系统提供了通用模型和制定结构化业务流的能力。通过图形化的方式对业务事件先后执行顺序的描述,刻画出更为直观、可理解的业务生命周期模型,也就是所谓的科学工作流模型,对企业事务进行更为高效、合理的管理运营。现如今,科学工作流的概念被运用到各个领域,不仅是企业的业务流程框架,更包括诸如高能物理学、生物信息学、大气科学等的学术研究,这些研究过程包含了海量的数据分析和处理步骤,科学家需要通过高层次的工具,将问题抽象化,搭建设计合理、高效的业务流程,以解决复杂、繁琐的高层次问题。而科学工作流提供了这样的环境,通过数据管理、分析、仿真和可视化的相互结合,以协助科学发现的过程。
日志,作为计算机网络安全的重要组成部分,记录着计算机每次运行事件的日期、时间、使用者、动作等相关操作。事件日志作为信息宝库,蕴藏着无穷的价值。通过对事件日志的分析研究,而获得整个项目或平台的结构化业务流,也就是科学工作流,将大大的方便科学家对现有工作平台,业务事件工作顺序的把控。通过计算机记录的事件日志而挖掘生成的科学工作流更具有真实性,更贴近、符合实际业务事件执行的先后次序。其价值之高在于一方面方便业务架构师在原有业务模型的基础上,对业务流程进行重构、优化,另一方面也有助于通过可视化图形对实际业务流中存的问题、缺陷进行进一步的优化和完善,以提高整个业务流的运行效率与质量。
随着科技的发展,各个学术领域中所研究的问题规模日益增大。大型科学工作流通常需要在复杂的分布式计算机系统上执行,例如超级计算机、分布式集群系统以及网络系统等。然而,构造这样的系统往往需要付出异常昂贵的代价,申请访问这些系统也需要复杂耗时的过程。
发明内容
本发明的目的在于提供一种基于事件直接先于关系的云间科学工作流挖掘方法,该方法能够解决在分布式云平台环境下的科学工作流挖掘问题,具有高效性、完备性和灵活性的特点。
实现本发明目的的技术方案为:一种基于事件直接先于关系的云间科学工作流挖掘方法,通过事件日志信息,挖掘跨云平台下的科学工作流,以XES格式描述的事件日志为输入,以SVG为格式的云间科学工作流为输出结果,该方法具体包括以下步骤:
步骤1,输入以XES格式描述的事件日志,解析事件日志获得事件,生成对应的事件序列集合,根据事件序列集合获得事件直接先于关系,完成云内科学工作流的挖掘;
步骤2,各个云平台分别挖掘完成各自云平台内的科学工作流后,两两云平台之间同时进行消息传递,完成初步跨云间的科学工作流的挖掘;
步骤3,通过步骤2的跨云间科学工作流的挖掘,对整个云平台联盟下的总体科学工作流进行归约、合并和简化处理,得到跨云间的科学工作流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610698348.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:会诊系统
- 下一篇:一种基于数据挖掘的配电网故障精准定位方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理