[发明专利]一种面向基因组检测数据传输和预处理的处理方法及系统有效
申请号: | 201510663214.1 | 申请日: | 2015-10-14 |
公开(公告)号: | CN106603591B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 王振飞 | 申请(专利权)人: | 北京聚道科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 11006 北京律诚同业知识产权代理有限公司 | 代理人: | 祁建国;梁挥 |
地址: | 100098 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基因组测序数据传输、分析与检测领域,特别涉及一种面向基因组检测数据传输和预处理的处理方法及系统,该方法包括:获取所述基因组检测数据,将所述基因组检测数据进行分块,其中若所述基因组检测数据为单链数据,则M个Read短序列的所述基因组检测数据,按照每N个Read短序列一个分块,分为P=INT(M/N),INT()为向上取整函数,P为分块数量,若所述基因组检测数据为双链数据,则链数据R1与链数据R2分别按照单链数据分块方法进行分块,生成R1分块数据与R2分块数据,且每个所述R1分块数据与所述R2分块数据的其中之一相匹配,反之亦然;将分块数据传输到服务器进行基因组分析与检测。本发明基因组数据预处理时间花费显著减小且增加了处理过程的容错性。 | ||
搜索关键词: | 一种 面向 基因组 检测 数据传输 预处理 处理 方法 系统 | ||
【主权项】:
1.一种面向基因组检测数据传输和预处理的处理方法,其特征在于,包括:/n步骤1,获取所述基因组检测数据,将所述基因组检测数据进行分块,其中若所述基因组检测数据为单链数据,则M个Read短序列的所述基因组检测数据,按照每N个Read短序列一个分块,分为P=INT(M/N),INT()为向上取整函数,P为分块数量,若所述基因组检测数据为双链数据,则链数据R1与链数据R2分别按照单链数据分块方法进行分类,生成R1分块数据与R2分块数据,且每个所述R1分块数据与所述R2分块数据的其中之一相匹配,反之亦然;/n分块数据中包含的短序列数为大于等于1小于等于样本所包含的Read短序列数M之间的任一个整数;/n步骤2,将分块数据传输到服务器进行基因组分析与检测;以流式的方式处理,当所有的分块的处理流程都处理完成,就得到了全部样本基因组测序数据与样本所属物种的标准参考基因组进行mapping的结果数据,该结果数据可以按需被后续的各种处理流程使用;/n将所述R1分块数据与所述R2分块数据中相匹配的分块数据放置到同一数据包或者保证所述R1分块数据与所述R2分块数据中相互匹配的分块数据同时上传成功并同时作为一个基因组数据预处理任务的输入。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京聚道科技有限公司,未经北京聚道科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510663214.1/,转载请声明来源钻瓜专利网。