[发明专利]超低频突变分子一致性序列简并算法有效
申请号: | 201610348484.8 | 申请日: | 2016-05-24 |
公开(公告)号: | CN106021986B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 曾华萍;宋卓;袁梦兮 | 申请(专利权)人: | 人和未来生物科技(长沙)有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;C12Q1/68 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 410152 湖南省长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种确定测序读段群共有序列的方法,该方法包括:(1)将所述测序读段群根据基本的比对情况进行第一过滤,以便获得经过第一过滤的测序读段群,(2)针对所述经过第一过滤的测序读段群的每一个,确定该测序读段群的共有序列,(3)针对所述经过第一过滤的测序读段群的每一个,类似(2)所述的步骤确定该测序读段群的共有标签序列。通过该方法能够有效确定来源于同一DNA分子经多次重复测序而得到的测序读段群的共有序列,从而实现对DNA分子和突变精确的定量,同时消除测序错误等对结果的影响,保障结果的准确性。 | ||
搜索关键词: | 低频 突变 分子 一致性 序列 算法 | ||
【主权项】:
1.一种确定测序读段群共有序列的方法,所述方法包括:(1)将所述测序读段群根据基本的比对情况进行第一过滤,以便获得经过第一过滤的测序读段群,所述第一过滤的标准如下列:(a)排除双末端分别与参考序列的不同染色体匹配的测序读段群;(b)排除插入片段在预定范围之外的测序读段群;以及(c)排除测序读段的起始位置与扩增引物起始位置不同的测序读段群;(2)针对所述经过第一过滤的测序读段群的每一个,按照下列步骤确定该测序读段群的共有序列:(i)在预定位置,遍历群内每一个测序读段,统计ATCG四种碱基的各自深度;(ii)选择具有显著深度优势的碱基作为所述预定位置的碱基类型,并根据该碱基类型的深度得到所述预定位置的质量值;(iii)针对所有位置,重复步骤(i)和(ii),以便确定所述共有序列,(3)针对所述经过第一过滤的测序读段群的每一个,按照类似(2)所述的步骤确定该测序读段群的共有标签序列:(A)遍历群内每一个测序读段的标签序列,统计各标签序列的深度;以及(B)选择具有显著深度优势的标签序列作为该测序读段群的共有标签序列;其中,所述(ii)进一步包括:(A’)在预定位置,将ATCG四种碱基按深度进行排序,以便获得最大深度和第二深度,以及其所对应的碱基类型;(B’)基于所述最大深度和第二深度,确定所述预定位置的共有序列碱基类型和对应的质量值;所述(B’)包括:确定参数C,其中参数C=(最大深度‑第二深度)/最大深度;如果参数C不低于指定阈值,则选择所述最大深度的碱基作为所述预定位置的共有序列碱基类型,且该碱基的质量值Q=20+(max*C^2)/2,当Q>40时,取40;如果所述参数C小于指定阈值,则确定所述预定位置的共有序列碱基类型为不确定碱基N,相应质量值Q=2;所述max指所述最大深度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610348484.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种钢丝绳散头抱紧装置
- 下一篇:一种基因组数据压缩方法