[发明专利]用于检测序列变异体的系统有效
申请号: | 201480065432.9 | 申请日: | 2014-09-30 |
公开(公告)号: | CN105793859B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 丹尼斯·库拉尔 | 申请(专利权)人: | 七桥基因公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;C12Q1/6874 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 王庆艳;刘继富 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 序列 异体 系统 | ||
本发明提供了用于识别接近遗传序列中的结构变异的罕见变异体的方法,举例来说,该遗传序列是在取自受试者的核酸样本中。本发明另外包括用于将读数(例如,核酸读数)与导致该结构变异的参考序列构建体比对的方法,用于构建导致该结构变异或该结构变异和该罕见变异体的参考序列构建体的方法,和使用这些比对方法识别罕见变异体的系统。该方法是可规模化的,并且可以用以将数百万读数与数千碱基长或更长的构建体比对。
本申请要求美国专利申请第61/884,380号和第14/041,850号的优先权,其两者都在2013年9月30日提交并且其两者都以全文引用的方式并入。
技术领域
本发明涉及用于使序列(例如,核酸序列)彼此比对以产生对应于样本(例如,遗传样本)的连续序列读数的方法和系统。本发明另外涉及用于识别样本中的变异体的方法。
背景技术
遗传学已经从分析科学演变为信息科学。然而,科学家此前一直努力研究如何提取和识别核酸,此类技术现在看来并非那么重要。下一代测序(例如,全转录组鸟枪测序、焦磷酸测序、离子半导体测序、合成测序)可以在仅几天内产生覆盖全基因组的数百万读数。为了实现此产出量,NGS测序在较小核酸序列上使用大规模并行化,这些较小核酸序列一起构成大量遗传信息,例如,染色体或基因组。从遗传样本开始,核酸(例如,DNA)分裂、扩增并且以极快速度读取。考虑到这些能力,科学家现在努力研究如何(以低成本)比对读数以识别序列中指示疾病或疾病风险的基因座。
当前技术发展水平的比对方法使用大规模计算能力来将重叠的读数与参考比对以产生可以探测用于重要遗传或结构信息(例如,用于疾病的生物标记)的序列。最终,序列比对的目标是组合由测序仪产生的核酸读数集合以实现较长读数(即,重叠群)或甚至基于来自受试者的遗传样本的该受试者的全基因组。因为来自下一代测序仪的序列数据通常包含一起呈现目标序列的总数的数百万较短序列,所以比对读数是复杂并且计算上昂贵的。另外,为了使由随机测序误差(即,不正确的测序机输出)引起的序列失真减到最少,对探测的序列的每个部分进行多次(例如,2次到100次或更多次)测序,以使任何随机测序误差对所产生的最终比对和输出序列的影响减到最小。最后,一旦收集了对应于所有核酸读数的所有数据,针对单个参考序列(例如,GRCh37)比对这些读数,以便确定所有(或一部分)受试者的序列。在许多情况下,实际上不显示个别读数,而是将所比对的序列组装为一个序列,并且该序列被提供为数据文件。
典型地,通过聚集两串线性序列信息之间的成对的比对来构筑序列比对。作为比对的一个实例,可以将两个字符串S1(SEQ ID NO.12:AGCTACGTACACTACC)和S2(SEQ IDNO.13:AGCTATCGTACTAGC)针对彼此进行比对。S1典型地对应于读数,并且S2对应于参考序列的一部分。S1和S2可以相对于彼此由取代、缺失和插入组成。典型地,关于将字符串S1转化为字符串S2来定义这些术语:当S2中的字母或序列通过S1中相同长度的不同字母或序列置换时发生取代,当S2中的字母或序列在S1的相应区段中“跳过”时发生缺失,并且当在S1中字母或序列在S2中相邻的两个位置之间出现时发生插入。举例来说,两个序列S1和S2可以进行如下比对。以下比对呈现出十三处匹配,一处缺失长度一,一处插入长度二,以及一处取代:
(S1)AGCTA-CGTACACTACC(SEQ ID NO.12)
(S2)AGCTATCGTAC--TAGC(SEQ ID NO.13)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于七桥基因公司,未经七桥基因公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480065432.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像搜索方法及设备
- 下一篇:一种基于app的会员信息分类方法及系统