[发明专利]生物分子数据的高效共享方法在审
申请号: | 201010288419.3 | 申请日: | 2010-09-21 |
公开(公告)号: | CN102411572A | 公开(公告)日: | 2012-04-11 |
发明(设计)人: | 陈平;宋立宇;鲁方;孔令印;王敏;王翊 | 申请(专利权)人: | 重庆诺京生物信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 401121 重庆市北*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 分子 数据 高效 共享 方法 | ||
技术领域
本发明涉及一种数据的高效共享方法。
背景技术
生物多样性是生物的基本属性,可以从分子、细胞、生物个体等不同的方向进行研究。随着测序技术和计算机技术的发展,产生了海量的生物分子数据。由于生物分子领域的复杂性,使得该领域的研究呈现出周期长、研究结果复杂、研究难度大、数据量大等特点。目前,世界上成千上万的研究者对生物分子进行过研究,为了保存研究得到的结果数据,以及有利于世界各地的研究者相互借鉴研究成果和长期持续性的研究,就需要对结果数据进行组织操作,即功能描述、调整顺序、修补剪切、存储等操作。由于不同的研究者采用的计算机系统千差万别,对不同功能软件的熟知程度业不同,用于加工生物分子数据的软件数据结构也千差万别,因此产生了大量存储于不同计算机系统的不同类型和格式的生物分子数据,为共享生物分子数据带来了巨大的麻烦。
例如:科学家1在A研究中通过某种手段,得到了某生物物种1号染色体的研究结果--1号染色体的生长基因数据,该研究结果按照NCBI(美国国立生物信息数据中心)推荐的GenBank数据描述格式或数据结构描述后,以文件的形式提交到NCBI数据库发布。
科学家2在B研究中通过某种手段,得到了该生物物种2,3号染色体的研究结果--2,3号染色体的生长基因数据,该研究结果按照EMBL(欧洲生物信息数据中心)推荐的EMBL数据描述格式进行描述后,以文件的形式提交到EMBL数据库发布。
科学家3在C研究中,希望使用科学家1和科学家2的研究成果进行后续研究。但是科学家1和科学家2的研究结果被提交到了两种不同的计算机系统中的数据结构不同的数据库中,由于上述数据库的数据描述格式,即数据结构存在差异,科学家3需要花费大量的时间解析上述科学家1和科学家2存储在NCBI数据库和EMBL数据库中的数据文件,无法直接参考利用上述来源于不同数据库的相关数据文件进行后续的分析研究。即使科学家针对采用不同数据结构的生物分子数据文件编制不同的数据解析程序自动完成文件中数据的解析,由于解析程序的相对独立性,也难以从整体上提高数据解析速度且实现方案麻烦,同时数据共享效率仍然没有提高,这给科学家3的研究带来了困难。
可见,现有的用于组织分子生物数据的数据结构复杂多样,要使用采用这些数据结构组织起来的数据,就要了解具体的数据结构,显然,要了解大量复杂的数据结构才能解析和使用其组织的数据,会极大限制生物分子数据的数据处理速度和降低数据共享效率。
发明内容
本发明要解决的问题在于,提供一种能够高效共享生物分子数据的生物分子数据的高效共享方法。
本发明提供的生物分子数据的高效共享方法实施例,包括:
选择每一种生物分子数据文件的数据结构中有意义的字段;
组合所述字段,直到每一种生物分子数据文件的数据结构中有意义的字段都被选择;
按照所述字段表达信息的逻辑排列组合所述字段,形成新的字段集合;
用所述集合中的字段生成生物分子数据文件的新数据结构。
使用拥有所述新数据结构的新生物分子数据文件承载读取到的生物分子数据文件中的数据。
按照本发明实施例提供的方法,无论现有的生物分子数据文件采用的数据结构有多么不同以及数量有多少,由于构成新数据结构的字段集合以现有的生物分子数据文件的数据结构为基础,都可以将不同生物分子数据文件的内容自动统一到新的文件中,由于新文件的数据结构具有预先设定的特性,这样就能预先编制基于新数据结构的数据处理程序,对每一种生物分子数据文件进行解析,因此可以加快生物分子数据文件的解析速度,解析数据时也无需再考虑现有的生物分子数据文件采用的数据结构,通过统一来源不同、数据结构不同的生物分子数据文件,将杂乱无章的生物数据转换为易于操作的通用数据结构,有利于背景不同,水平不同的生物分子研究者都能从已有的生物分子数据文件中,获取自己所需的信息,从而进一步提高了生物分子数据的数据处理速度和数据共享效率。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明所述方法的第一实施例的步骤流程图;
图2是本发明所述方法的第一实施例的步骤流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆诺京生物信息技术有限公司,未经重庆诺京生物信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010288419.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:悬挂稳定的加长型衣架
- 下一篇:悬挂稳定的加长型衣架结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置