[发明专利]一种检测拷贝数变化的方法有效
申请号: | 202110770842.5 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113249453B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 李珉;姜玥;梁萌萌 | 申请(专利权)人: | 苏州赛美科基因科技有限公司 |
主分类号: | C12Q1/6858 | 分类号: | C12Q1/6858;G16B20/20 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 刘洪勋 |
地址: | 215100 江苏省苏州市相城区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 拷贝 变化 方法 | ||
1.一种检测拷贝数变化的方法,其特征在于,包括以下步骤:
(1)将样本DNA加上UMI碱基,进行基于2X设计的多重PCR建库测序,获得带UMI标签的样本测序数据,对样本测序数据进行质控后,再与参考基因组进行比对,获得比对数据,所述样本包括测试样本和对照样本;UMI碱基,即由碱基短序列组成的分子条形码;
(2)根据样本测序数据及引物坐标信息计算样本测序数据中的每个扩增子的测序序列数目,得到矩阵文件,矩阵文件中每列代表一个样本,每行代表一个扩增子的测序序列数目;对矩阵文件进行校正;
校正后的矩阵文件,将矩阵文件每行取平均数或中位数,用测试样本的某个扩增子所在行的平均数或中位数,除以对照样本对应于测试样本的某个扩增子所在行的平均数或中位数,得到比值;
其中,所述对矩阵文件进行校正的方法如下:
先按行进行几何平均:
得到如下矩阵:
再计算列的中位数Corr:
校正
其中,M为校正前矩阵文件,M*为校正后矩阵文件,a代表每个样本在每个引物扩增区间计算得到的测序深度,g代表每行即每个引物扩增区间所有样本取几何平均数,Test 为待测样本,Ctrl为对照样本,b代表每个样本在每个引物扩增区间的测序深度校正后的数值,med为每列取中位数即每个样本所有引物扩增区间的深度取中位数,mean为取平均数,即对所有对照样本校正后的深度按行计算平均数;
(3)根据比值结果进行以下判断:
根据测试样本的扩增子的分析结果判断该扩增子目标区域CNV情况:
其中,第1X和第2X表示同一扩增区域中的两对引物,不分先后顺序。
2.根据权利要求1所述的检测拷贝数变化的方法,其特征在于,步骤(1)中对样本测序数据进行质控,包括数据量合格、平均测序深度达到要求、数据质量Q2090%,Q30 85%。
3.根据权利要求1所述的检测拷贝数变化的方法,其特征在于,步骤(1)中样本测序数据是使用sentieon软件的UMI的流程得到consensus 的fastq文件,所述比对数据是fastq文件再经过bwa 软件和参考基因组进行比对,经过sentieon 的UMI 处理后得到consensus的bam;
步骤(2)中,根据样本测序数据及引物坐标信息计算样本测序数据中的每个扩增子的测序序列数目的具体方法如下:
使用python中的pysam模块对经过sentieon 的UMI 处理后得到consensus的bam进行处理,得到每条序列比对到参考基因组的起始终止坐标,将序列坐标与引物的坐标一致的进行计数,得到该引物扩增的序列数目,其他引物以此计算方式进行扩增区域序列数目的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州赛美科基因科技有限公司,未经苏州赛美科基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110770842.5/1.html,转载请声明来源钻瓜专利网。