[发明专利]一种基于长读序测序判断重叠组装正误的方法有效
申请号: | 201710720048.3 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107590362B | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 邬三毛;肖世俊;郭文浒;陈楠生 | 申请(专利权)人: | 武汉菲沙基因信息有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 11212 北京轻创知识产权代理有限公司 | 代理人: | 杨立;李蕾<国际申请>=<国际公布>=< |
地址: | 430075 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于长读序测序数据判断重叠组装正误的方法,通过将长读序测序数据比对到待处理的重叠组装结果来进行,所述长读序测序中的平均读长不小于2kb。通过使用本发明的方法,可在重叠组装成contig的阶段对重叠组装的正误进行判断,剔除错误的重叠组装,提供可信度更高的contig序列信息。 | ||
搜索关键词: | 一种 基于 长读序测序 判断 重叠 组装 正误 方法 | ||
【主权项】:
1.一种基于长读序测序数据判断重叠组装正误的方法,其特征在于,通过将长读序测序数据比对到待处理的重叠组装结果来进行,所述长读序测序中的平均读长不小于2kb,且包括以下步骤:/nS1:获得长读序测序数据;/nS2:将所述长读序测序数据与待处理的重叠组装结果进行比对,得到比对结果;/nS3:根据所述比对结果的信息来对所述重叠组装结果进行正误判断;/n其中,所述S2包括以下步骤:/nS21:将所述长读序测序数据比对到所述重叠组装结果;/nS22:对所述长读序测序数据中同一条读序的比对进行聚类和处理,选取总比对长度最长的一类作为该读序的最终比对,合并离散比对;/nS23:依次扫描所述重叠组装结果的每条重叠组装序列的比对,记录异常中断窗口、所述异常中断窗口的异常断点数以及所述异常中断窗口被所述长读序测序数据中的读序跨过次数;/n所述比对结果包括所述异常中断窗口中的异常断点数以及被所述长读序测序数据中的读序跨过次数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉菲沙基因信息有限公司,未经武汉菲沙基因信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710720048.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种机床工作台可旋转的研磨机
- 下一篇:一种磨针机