[发明专利]一种基于新一代测序数据的插入变异检测方法及系统有效
申请号: | 201910381319.6 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110299185B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 袁细国;谢文路;李杰;习佳宁;杨利英;张军英;许向彦 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 新一代 序数 插入 变异 检测 方法 系统 | ||
1.一种基于新一代测序数据的插入变异检测方法,其特征在于,所述基于新一代测序数据的插入变异检测方法包括以下步骤:
第一步,在确定变异发生位点时,有插入变异发生的区域一定会产生分裂读段,针对新序列插入、序列串联倍增、序列散在倍增插入变异类型及缺失变异、倒置变异的分裂读段分布不同的特性;
第二步,在确定插入变异发生种类及位点之后,通过利用部分匹配、完全匹配、以及未匹配的读段信息来构造一条虚拟参考序列,与原始参考序列比较得到插入序列的相关信息;
第三步,利用拷贝数状态信息获得变异基因型;
所述第一步通过分裂读段特性对变异信号进行筛选分类后,定义每个变异点必须至少覆盖NSR条reads确定为一个插入变异发生点,NSR的定义由下式;
其中,Re表示每个碱基的测序错误率,LR表示read的长度,NR表示总的reads数,Qi表示第i条read的比对质量,表示下取整;Re设置为0.01。
2.如权利要求1所述的基于新一代测序数据的插入变异检测方法,其特征在于,所述第一步具体包括:
(1)对于新序列插入,变异位点所覆盖的分裂读段为单一对应混合读段,该变异点下既有前半部分匹配的读段,又有后半部分匹配的读段,且读段在参考序列上均为单一对应;
(2)对于序列串联倍增,只有其倍增序列连接部分会产生分裂读段,分裂读段会在一定区域内进行双映射,同一读段在参考序列上映射到一定区域内的两个位点,且在映射的位点上存在的分裂读段匹配情况一致;
(3)对于序列散在倍增,在其倍增序列左右位点处会产生分裂读段,分裂读段会进行多重映射,同一读段在参考序列上映射到两个以上位点,且其中一个位点是原始序列的开始或终止处,对于映射到原始序列开始或结束处的分裂读段出现原始序列部分匹配。
3.如权利要求1所述的基于新一代测序数据的插入变异检测方法,其特征在于,所述第二步检测较长的插入变异时,从每个变异点开始拓展,每次选择左半部分匹配得分最高的分裂读段进行动态拼接后重新比对得到新的分裂读段,当没有分裂读段拼接时,则停止迭代。
4.如权利要求1所述的基于新一代测序数据的插入变异检测方法,其特征在于,所述第三步利用每个位点的覆盖度信息获得拷贝数状态信息,所有的插入区域其拷贝数状态都为正常,则样本的read覆盖度服从高斯分布N(μ,σ2),其中μ为样本读段深度均值,样本均值和方差可由固定大小滑窗获得每一滑窗内位点覆盖度均值后计算所得;将零分布转换成一个标准的正态分布后,通过求得插入区域p值,通过对p值的分析可得变异基因型信息。
5.一种利用权利要求1-4任意一项所述基于新一代测序数据的插入变异检测方法的检测系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910381319.6/1.html,转载请声明来源钻瓜专利网。