[发明专利]一种通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法在审
申请号: | 202110433911.3 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113192555A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 梁媛媛;许雄;肖锐;侯敏;陈梦婷;李海波;施丹华;田丽蕴;徐军;邱海燕 | 申请(专利权)人: | 杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B30/10 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310030 浙江省杭州市西湖区三*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 计算 差异 等位基因 深度 检测 二代 序数 smn 基因 拷贝 方法 | ||
1.一种通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于包括如下步骤:
1)屏蔽参考基因组的SMN2第7外显子第一个碱基到第8外显子最后一个碱基,即chr5:69372348-69373422,之后建立参考基因组的索引;
2)探针捕获二代测序数据,对测得的原始数据进行序列质量过滤,然后比对到上述参考基因组上,所有SMN1和SMN2的第7、8外显子测序序列全部比对到SMN1相应位置,且在两个基因的单核苷酸差异处有SNP,将比对结果排序,去除重复序列;
3)计算每个样本在bed文件每个区间的绝对平均深度,计算各区间绝对平均深度的平均值并记录;利用此平均值对每个区间进行样本内覆盖深度的标准化,计算各样本各区间的相对平均深度,使区间的覆盖深度不受测序数据量的影响;
4)利用所述区间的相对平均深度分布数据计算两两样本相关系数,利用相关系数矩阵画热图,剔除质控失败样本;
5)检测chr5:70220000-70250000范围内的变异,输出每个变异的DP和AD;
6)根据AD筛选对照样本,计算对照样本相对深度中位数;
7)样本量小于五十时,使用以上对照样本作为固定参考集,单个样本与参考集计算相关系数,单独计算相对于固定参考集的SMN拷贝数;样本量大于五十时,批次内挑选对照样本建立参考集,再分别计算批次内每个样本相对于参考集中位数的总拷贝数,计算AD,分配总拷贝数。
2.根据权利要求1所述的通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于,步骤2)中所述的探针捕获二代测序数据具体为,使用相同的探针捕获试剂,试剂需要至少覆盖SMN基因的第7、8外显子,探针区间个数的数量级可以是百、千、万。
3.根据权利要求1所述的通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于,步骤4)剔除质控失败样本为剔除与其他样本相关性0.9的异常样本。
4.根据权利要求1所述的通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于,步骤4)中计算两两样本相关系数时,剔除性染色体上的区间,从而消除样本性别的影响。
5.根据权利要求1所述的通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于,所述步骤5)中,对于第7外显子,若结果中有chr5-70247773-C-T变异,则此变异的AD即第7外显子SMN1/SMN2单核苷酸差异的AD,即AD_E7_SampleName,若结果中无此变异,则SMN2第7外显子拷贝数为0;对于第8外显子,若结果中有chr5-70248501-G-A变异,则此变异的AD即第8外显子SMN1/SMN2单核苷酸差异的AD,即AD_E8_SampleName,若结果中无此变异,则SMN2第8外显子拷贝数为0。
6.根据权利要求1所述的通过计算差异等位基因测序深度检测二代测序数据SMN基因拷贝数的方法,其特征在于,所述步骤6)为,挑选AD_E7_SampleName和AD_E8_SampleName都介于0.9~1.1的样本作为对照样本,为消除试剂捕获区间与实际外显子区间的偏差,重新计算这些样本的第7外显子E7绝对深度DP_E7_SampleName(染色体位置为chr5:70247768-70247821)、第8外显子E8绝对深度DP_E8_SampleName(染色体位置为chr5:70248266-70248839);并用AVG_SampleName进行校正,DPnorm_E7_SampleName和DPnorm_E8_SampleName分别是标准化后的第7、8外显子相对深度,公式为:
DPnorm_E7_SampleName=DP_E7_SampleName/AVG_SampleName;
DPnorm_E8_SampleName=DP_E8_SampleName/AVG_SampleName;
获取所有对照样本标准化后第7、8外显子相对深度的中位数,分别为Median_E7、Median_E8。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院,未经杭州博圣医学检验实验室有限公司;宁波市妇女儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110433911.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种料斗刮料装置
- 下一篇:一种农作物环保秸秆处理设备