[发明专利]一种基于新一代测序数据的插入变异检测方法及系统有效
申请号: | 201910381319.6 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110299185B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 袁细国;谢文路;李杰;习佳宁;杨利英;张军英;许向彦 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 新一代 序数 插入 变异 检测 方法 系统 | ||
本发明属于基因组测序技术领域,公开了一种基于新一代测序数据的插入变异检测方法;在确定变异发生位点时,有插入变异发生的区域一定会产生分裂读段,针对新序列插入、序列串联倍增、序列散在倍增等插入变异类型及缺失变异、倒置变异的分裂读段分布不同的特性;在确定插入变异发生种类及位点之后,通过利用部分匹配、完全匹配、以及未匹配的读段信息来构造一条虚拟参考序列,与原始参考序列比较得到插入序列的相关信息;利用拷贝数状态信息获得变异基因型。本发明能够解决插入变异位点判定不准确的问题;能够解决SR方法检测插入变异造成遗漏的问题;能够解决现有技术遇到重复序列可能会检测出错的问题。
技术领域
本发明属于基因组测序技术领域,尤其涉及一种基于新一代测序数据的插入变异检测方法。
背景技术
目前,最接近的现有技术:基于新一代测序技术的split read分析方法。新一代测序是一种DNA测序技术,在测序过程中,将完整的样本DNA序列打碎,从中筛选出满足特定长度(通常为数百bp)的片段,在每个片段的一端或两端各读取一段长度为数十至数百bp的序列。读取出的序列长度通常远远小于被测样本DNA序列的长度,但是新一代测序技术可以同时读取大量这样的短序列,使得全部短序列的总长度达到样本DNA长度的数倍至数十倍,使获得样本DNA序列成为可能。插入变异是基因组中的一种重要的变异现象,是人类基因组结构变异的一种形式,并且与人类的疾病发生密切相关。
目前主要有4种检测基因组上插入变异的策略,分别为:(1)Read pair(也称为Pair-end Mapping,简称PEM,双端映射);(2)split read(简称SR,分裂读段);(3)ReadDepth(简称RD,读段覆盖深度);(4)de novo Assembly(简称AS,序列从头组装)。
PEM分析方法:Pair-End(PE)测序的两条read(通常称为Read1和Read2)来自于同一个序列片段,因此,Read1和Read2之间存在着客观的物理关联,而Read1与Read2之间的距离,称为插入片段长度(insert size)。对于PEM方法,插入片段长度的分布是进行变异检测的一个关键信息,将样本Pair-end读段比对到参考序列上,其插入片段长度一般符合正态分布。因此,若某一对读段插入片段长度有异常,组成Read1和Read2的这个序列片段和参考基因组相比就存在着对应序列上变异的可能,比如,若某一对读段的映射长度小于样本平均插入长度,则在其对应的序列上可能存在插入变异。但是,PEM方法所拥有的缺陷在于,对于插入变异序列的检测,受限于Read1与Read2之间的客观物理关联,其检测长度无法超过插入片段的长度,另外,对于小于插入长度的插入变异,其检测精度也受限于插入片段长度的标准差。
SR分析方法:splitread是一类特殊的read,其出现通常是由基因组中的结构变异造成的,这类read在映射中不再保持连续序列的形式,而是包含了一定长度的不匹配部分,因此具有较高的映射难度。SR分析方法首先提取具有以下特点的pair-end读段,一条可以正常比对到参考序列上,另外一条不能比对,这里的不能比对指的是在这一条read上,只有其中一部分可以匹配到参考序列的某个位置,而另外一部分不能正确匹配,或者匹配的位置与前一部分的匹配位置不连续。提取出这些特点的pair-end读段后,利用正常比对的读段位置和插入长度确定一个查找范围,在这个范围内寻找未比对上的读段与参考序列的最佳匹配,通过最佳匹配点把未匹配的读段分割成多段,确定插入变异发生的位置。SR分析方法的缺陷在于单纯利用splitread信息只能初步确定可能发生变异的位点,现有方法大多利用疑似变异发生位点进行序列局部组装,利用split read信息局部组装contig,但是对于拥有重复片段的插入变异区域,即变异来源于基因内部片段的区域,组装contig时会遇到组装终止异常问题,造成组装无法终止或提前终止,导致插入片段的错误检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910381319.6/2.html,转载请声明来源钻瓜专利网。