[发明专利]面向蛋白质组学数据分析的基于provenance的工作流匹配和发现系统在审
申请号: | 201310380982.7 | 申请日: | 2013-08-28 |
公开(公告)号: | CN103440553A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 翟广猛;卢暾;黄兴;陈昭灿;顾宁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 蛋白质 数据 分析 基于 provenance 工作流 匹配 发现 系统 | ||
技术领域
本发明属于计算机支持的科学工作流技术领域,具体涉及一个面向蛋白质组学数据分析,并支持基于provenance的工作流的匹配和发现系统。
背景技术
关于e-science中的科学工作流 科学工作流技术在科学研究领域越来越受重视,研究人员已经开始在他们的科学研究中应用一些成熟的科学工作流管理系统,这一做法极大地促进了科学研究中的发现。如今,随着网络技术发展愈加的成熟,为了提高科研领域的协作性,一些组织将实验数据、计算和和分析工具等科研资源以web服务的形式发布出去,其他科学家可以通过网络将这些共享资源应用到他们的科学研究中。为了有效地组织这些分布式的资源,研究人员们设计了一些科学工作流和科学工作流管理系统。在这些系统的帮助下,研究人员可以编排计算密集型的工作任务,分析大批量的数据,整合分布式的资源和本地资源,可以将更多的精力放在专业问题的解决上而不必花费过多的时间在计算和数据资源的组织管理上。
目前比较典型的科学工作流管理系统有Taverna ,Kepler,Triana等。Taverna是一个开源的科学工作流管理系统,主要应用于生物信息学领域。Taverna可以整合多种共享的web服务,包括以下几种类型:Arbitrary WSDL type , Soaplab type, Talisman type, Nested workflow type , String constant type, Local processor type。它为用户提供了一个可视的操作平台,在这个平台上生物学家可以使用这些服务来描述和执行以数据为中心的科学工作流。它还提供了web服务发现,异常处理及provenance信息获取等功能。与Taverna相似,Kepler也是一个面向生物信息学领域并且开源的科学工作流管理工具。除了一般的共享web服务,它可以整合诸如数据库一类的资源,并且提供了灵活的控制策略来组合这些资源。Triana主要用于分布式环境下的服务和工作流的执行。与Taverna和Kepler不同,Triana可以应用于不同的领域。
随着科学研究复杂性的增加,在科学研究中使用的共享资源越来越多,为了实现资源出处的追踪,准确性的审查以及实验执行步骤的再现,科学家们开始将provenance引入到科学工作流中。
关于provenance 因为科学研究的不确定性,必须提供一种机制可供科学家们审查科学实验的结果有效性和正确性。另外随着科学研究中协同合作现象的愈加普遍,贡献的认证也引起人们的注意。Data Provenance(数据起源/世系)记录了科学工作流执行过程中产生的实验数据的历史信息,内容包括数据对应的初始数据和初始数据演变为当前数据所经过的所有的处理步骤。作为一种新的技术,它被应用到科学工作流中。这不仅解决了上述问题,同时因为拥有记录数据起源,数据再生和数据共享,解释数据间的差异以及支持知识重用等能力,provenance在科学工作流中的重要作用得到了普遍的认可。
关于蛋白质组学数据分析(proteomics data analysis) 蛋白质组学是一门较新的科学研究领域。对蛋白质组学的研究将有助于解释生命科学,揭示生命的奥秘。然而对蛋白质组学数据分析事实上是一个多步骤并且复杂的流程。在蛋白质组学数据分析中使用科学工作流将大大地减轻研究人员的负担。最近几年蛋白质组学有了极大的发展,其中一个最重要的催动因素是愈加增多的开源或免费的数据分析工具。但是人们在使用这些工具的时候经常会遇到以下几种问题:1. 工具不易安装;2. 在没有专业人员指导的情况下无法使用这些工具;3.因为结果数据格式的不一致导致这些工具的接口不相容,因此不易组建数据分析流程。为了解决上述问题科学工作流被引入到蛋白质组学数据分析领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310380982.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置