[发明专利]超低频突变分子一致性序列简并算法有效

专利信息
申请号: 201610348484.8 申请日: 2016-05-24
公开(公告)号: CN106021986B 公开(公告)日: 2019-04-09
发明(设计)人: 曾华萍;宋卓;袁梦兮 申请(专利权)人: 人和未来生物科技(长沙)有限公司
主分类号: G16B20/00 分类号: G16B20/00;C12Q1/68
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 李志东
地址: 410152 湖南省长沙*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种确定测序读段群共有序列的方法,该方法包括:(1)将所述测序读段群根据基本的比对情况进行第一过滤,以便获得经过第一过滤的测序读段群,(2)针对所述经过第一过滤的测序读段群的每一个,确定该测序读段群的共有序列,(3)针对所述经过第一过滤的测序读段群的每一个,类似(2)所述的步骤确定该测序读段群的共有标签序列。通过该方法能够有效确定来源于同一DNA分子经多次重复测序而得到的测序读段群的共有序列,从而实现对DNA分子和突变精确的定量,同时消除测序错误等对结果的影响,保障结果的准确性。
搜索关键词: 低频 突变 分子 一致性 序列 算法
【主权项】:
1.一种确定测序读段群共有序列的方法,所述方法包括:(1)将所述测序读段群根据基本的比对情况进行第一过滤,以便获得经过第一过滤的测序读段群,所述第一过滤的标准如下列:(a)排除双末端分别与参考序列的不同染色体匹配的测序读段群;(b)排除插入片段在预定范围之外的测序读段群;以及(c)排除测序读段的起始位置与扩增引物起始位置不同的测序读段群;(2)针对所述经过第一过滤的测序读段群的每一个,按照下列步骤确定该测序读段群的共有序列:(i)在预定位置,遍历群内每一个测序读段,统计ATCG四种碱基的各自深度;(ii)选择具有显著深度优势的碱基作为所述预定位置的碱基类型,并根据该碱基类型的深度得到所述预定位置的质量值;(iii)针对所有位置,重复步骤(i)和(ii),以便确定所述共有序列,(3)针对所述经过第一过滤的测序读段群的每一个,按照类似(2)所述的步骤确定该测序读段群的共有标签序列:(A)遍历群内每一个测序读段的标签序列,统计各标签序列的深度;以及(B)选择具有显著深度优势的标签序列作为该测序读段群的共有标签序列;其中,所述(ii)进一步包括:(A’)在预定位置,将ATCG四种碱基按深度进行排序,以便获得最大深度和第二深度,以及其所对应的碱基类型;(B’)基于所述最大深度和第二深度,确定所述预定位置的共有序列碱基类型和对应的质量值;所述(B’)包括:确定参数C,其中参数C=(最大深度‑第二深度)/最大深度;如果参数C不低于指定阈值,则选择所述最大深度的碱基作为所述预定位置的共有序列碱基类型,且该碱基的质量值Q=20+(max*C^2)/2,当Q>40时,取40;如果所述参数C小于指定阈值,则确定所述预定位置的共有序列碱基类型为不确定碱基N,相应质量值Q=2;所述max指所述最大深度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610348484.8/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top