[发明专利]高通量测序数据质量过滤方法和过滤装置有效
申请号: | 201611236128.3 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106777262B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 陈晨;王震;于伟文 | 申请(专利权)人: | 上海华点云生物科技有限公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174;G06F16/182;G16B15/00 |
代理公司: | 北京邦信阳专利商标代理有限公司 11012 | 代理人: | 金玺 |
地址: | 200335 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种对高通量测序数据进行质量过滤的方法和装置,所述方法包括:根据所述高通量测序数据为并行计算做准备;通过并行计算过滤掉准备好的数据中质量不达标的数据。确定质量转换方式;数据切分;生成并行计算的执行实体。将第一文件和第二文件分别转换为第一RDD和第二RDD;将第一RDD和第二RDD分别切分为第一partition组和第二partition组;将第一RDD和第二RDD合并为第三RDD;将第三RDD切分为第三partition组。生成对第三partition组进行并行计算的执行实体task。采用本发明的技术方案,能够大大提高对高通量测序数据进行质量过滤的执行速度。 | ||
搜索关键词: | 通量 序数 质量 过滤 方法 装置 | ||
【主权项】:
一种对高通量测序数据进行质量过滤的方法,其特征在于,所述方法包括:根据所述高通量测序数据为并行计算做准备;通过并行计算过滤掉准备好的数据中质量不达标的数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海华点云生物科技有限公司,未经上海华点云生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611236128.3/,转载请声明来源钻瓜专利网。
- 上一篇:基于多源异构数据集的数据查询方法及装置
- 下一篇:交互信息显示方法及系统