[发明专利]拷贝数变异的检测方法和装置有效
申请号: | 202010403942.X | 申请日: | 2020-05-13 |
公开(公告)号: | CN111599407B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 曹善柏;王文平;张萌萌;郭璟;楼峰 | 申请(专利权)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B20/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拷贝 变异 检测 方法 装置 | ||
本发明提供了一种拷贝数变异的检测方法和装置。该检测方法包括:获取待测样本的测序比对数据;计算测序比对数据中每个碱基位点的测序深度;将参考基因组划分为多个bin的方式,利用每个碱基位点的测序深度,计算待测样本的每个bin的拷贝数;合并拷贝数与指定contig的倍性不同的bin,得到发生胚系拷贝数变异的区域。该方面能够检测出长度超过1000bp的基因外显子的缺失或重复,与现有技术中的芯片方法相比,该方法检测CNV具有更高的覆盖度、分辨率及更准确的拷贝数评估,不仅能够检测某些已知位点的拷贝数变异情况,而且可以检测未知的拷贝数变异情况,提高检测的灵敏度。
技术领域
本发明涉及生物信息分析领域,具体而言,涉及一种拷贝数变异的检测方法和装置。
背景技术
CNV是指长度大于1kb的拷贝数多态,是基因组结构变异(SV)的一种,包括拷贝数的缺失(deletion)、插入(insertion)、重复(duplication)和复杂多位点变异(complexmuti-site variants)。CNV的产生机制之一是DNA重组,包括非等位同源重组(Nonallelichomologous recombination,NAHR)和非同源末端连接(Nohomologous end-joining,NHEJ)等。DNA重组引起的CNV可以从以下几个方面影响基因的表达:(1)基因剂量;(2)基因断裂;(3)基因融合;(4)位置效应;(5)隐型等位基因显性化等。
CNV的检测有目前常用的有以下几种方法:
多重连接扩增技术(multiplex ligation dependent probe amplification,MLPA),针对每个待测靶基因设计相邻的两个探针,探针通过通用引物与靶序列配对杂交后,两个相邻的探针通过连接反应相连,连接产物的量与靶基因的拷贝数成正比。连接产物经PCR扩增后可以根据电泳结果分析基因的拷贝数。
芯片技术,这种技术是将感兴趣的靶点做成微阵列芯片,对基因组中关键区域进行系统性的扫描。目前应用较为广泛的芯片主要有比较基因组杂交芯片(comparativegenomic hybridization,CGH)和SNP芯片。这种技术只能检测已知的CNV。
发明内容
本发明的主要目的在于提供一种拷贝数变异的检测方法和装置,以解决现有技术中对突变检测的灵敏度低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种拷贝数变异的检测方法,该检测方法包括:获取待测样本的测序比对数据;计算测序比对数据中每个碱基位点的测序深度;将参考基因组划分为多个bin的方式,利用每个碱基位点的测序深度,计算待测样本的每个bin的拷贝数;合并拷贝数与指定contig的倍性不同的bin,得到发生胚系拷贝数变异的区域。
进一步地,获取待测样本的测序比对数据包括:获取待测样本的测序原始数据;对测序原始数据进行质控,得到测序比对数据;优选地,对测序原始数据进行质控,得到测序比对数据包括:对测序原始数据进行预处理,去除如下至少一种reads:(1)含有接头的reads;(2)质量低于阈值的reads,得到预处理数据;将预处理数据与参考基因组序列比对,得到比对结果数据;对比对结果数据进行过滤处理,过滤去除具有重复比对结果的reads,得到测序比对数据;更优选地,对比对结果数据进行过滤处理,进一步包括过滤去除目标捕获区域外的reads。
进一步地,在将参考基因组划分为多个bin的方式,计算待测样本的每个bin的拷贝数之前,检测方法还包括,将参考基因组划分为多个bin,并对待测样本的每个bin的测序深度进行归一化处理;然后利用归一化之后的测序深度计算每个bin的拷贝数;优选地,归一化处理包括:根据用于构建基线的样本在每个bin的测序深度,利用主成分分析法建立归一化模型;利用归一化模型对待测样本中的每个bin的测序深度进行归一化;优选地,利用归一化之后的测序深度,采用Viterbi算法计算待测样本的每个bin的拷贝数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010403942.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的家庭智能安全防护系统
- 下一篇:一种按摩式可调节手腕保护机构