[发明专利]面向基因测序大数据的云存储方法在审
申请号: | 201810314885.0 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108650298A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 刘辉 | 申请(专利权)人: | 常州大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F19/28;G06F19/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 基因测序 云存储 副本 分布式文件系统 高通量测序 并发访问 存储模式 存储容量 访问频率 分析过程 横向扩展 数据文件 可用性 客户端 条块 保存 | ||
1.一种面向基因测序大数据的云存储方法,其特征在于:包括以下步骤:
首先,根据数据文件的特点对基因测序大数据进行分类,然后根据分类结果选择存储策略的类型,将基因测序大数据上传到云存储服务器的各个存储节点进行存储;
其中,针对单个文件大、并发性能要求高、访问频率高以及可访问性要求高的数据文件采用条块化多副本存储策略;针对单个文件大、并发访问频率低、数据可用性要求高以及数据规模大的数据文件采用分布式多副本存储策略;针对文件数量大、整体容量大、但大多数文件较小、访问频率低以及数据可用性要求低的数据文件采用分布式单副本存储策略;
不同存储策略的存储过程为,
条块化多副本存储策略:将单个大文件分割成若干数据块,每个数据块保存在不同存储节点上,提高并发访问性能;每个数据块都存储在至少三个不同存储节点上,以提高数据可用性;
分布式多副本存储策略:构建分布式集群扩展存储空间以保存海量数据,每个文件在至少两个不同存储节点保存完整副本,提高数据可用性;
分布式单副本存储策略:构建分布式集群扩展存储空间以存储海量数据,每个文件只在一个节点上保存完整副本。
2.如权利要求1所述的面向基因测序大数据的云存储方法,其特征在于:上传数据文件至云存储服务器时,将文件名、文件大小以及存储路径保存至关系数据库中;检索数据文件时只需从关系数据库中读取对应的记录即可,从而加快数据检索速度;从客户端下载数据文件时,先从关系数据库中读取该文件的存储路径,再从云存储服务器中读取文件内容发送给客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810314885.0/1.html,转载请声明来源钻瓜专利网。