[发明专利]基因组拷贝数变异的检测方法和系统有效
申请号: | 201610350322.8 | 申请日: | 2016-05-24 |
公开(公告)号: | CN107423534B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 郝柯;张仲阳 | 申请(专利权)人: | 郝柯;张仲阳 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16H50/30;C12Q1/6827;C12Q1/6869 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 黄可峻 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了用于对受测者基因组中的拷贝数变异进行分析的方法。本发明的方法创新性地对从测序数据中提取的变量进行数学变换,导出新的二维变量,即测序深度比SDR和交替等位基因频率AAF或者交替等位单倍体频率AHF,进一步提高了信号/噪音比,提高了检测灵敏度和精度,更充分地利用了高通量DNA测序数据所包含的信息。另外,本发明的方法用于处理受测者体液样品中游离DNA,从测序数据中提取基因组某位点的CNV的特征信号时引入临近位点的信息,极大的提高了信号强度,可以有效地检测尿液或血清中游离DNA中的拷贝数变异。本发明还提供了用于实现上述方法的系统。 | ||
搜索关键词: | 基因组 拷贝 变异 检测 方法 系统 | ||
【主权项】:
一种用于对受测者(例如哺乳动物,特别是人)样品基因组中的拷贝数变异进行分析的方法,所述方法包括以下步骤:(a)采集参考样本,对其核酸进行测序,在其SNP位点上检测每个样本的基因型,对于每一个SNP位点,参考等位基因记为A,交替等位基因记为B,三种基因型为AA、AB和BB,获得SNP位点上的参考等位基因和交替等位基因的测序深度dA和dB,计算得到这个SNP位点的测序深度d,其中d=dA+dB,记其交替等位基因B占这个SNP位点的测序深度的比值为θ,即θ=dB/(dA+dB),θ∈[0,1];参考样本的个数设为N,检测的SNP位点个数设为M,对第i个SNP(i为1,2,3,…,M),获得其参考等位基因和交替等位基因的测序深度diA和diB,计算得到这个SNP位点的测序深度di,其中di=diA+diB,其交替等位基因B占测序深度的比值为θi=diB/(diA+diB),θi∈[0,1];当θi靠近0、0.5和1时对应AA、AB和BB基因型;以d为横坐标,θ为纵坐标做图,所述N个样本的每个SNP的di和θi值在图上形成相对于AA、AB和BB基因型的三个点簇,算出三个点簇的中心位置的Dg和Θg值,其中Dg和Θg值可为点簇上所有点的di或θi的平均值或中位数值:Dg=median(dj,j∈{i:gi=g}),g=AA,AB,BB;Θg=median(θj,j∈{i:gi=g}),g=AA,AB,BB。(b)通过线性插值法计算待测样本的每一个SNP在个体的正常状态下的测序深度d的期望值de;(c)对待测样本的核酸进行测序,获得其每个SNP测序深度;(d)计算得到待测样本的每个SNP位点的测序深度比,即SDR,其对数形式为LSDR;以及计算得到交替等位基因频率,即AAF,其中SDR=d/de;LSDR=log2(d/de);以及AAF=0,θ<ΘAA(θ-ΘAA)·0.5ΘAB-ΘAA,ΘAA≤θ<ΘAB(θ-ΘAB)·0.5ΘBB-ΘAB+0.5,ΘAB≤θ<ΘBB1,θ≥ΘBB]]>(e)采用隐马尔可夫模型分析上述步骤得到的数据,检查目标基因组的拷贝数变异状况。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郝柯;张仲阳,未经郝柯;张仲阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610350322.8/,转载请声明来源钻瓜专利网。