[发明专利]基于家系的低深度测序检测染色体单亲二体的方法在审
申请号: | 202110726077.7 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113593644A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 陈样宜;黄楷胜;刘燕霞;刘远如;焦伟刚 | 申请(专利权)人: | 广东博奥医学检验所有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 东莞众业知识产权代理事务所(普通合伙) 44371 | 代理人: | 何恒韬 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 家系 深度 检测 染色体 单亲 方法 | ||
1.一种基于家系的低深度测序检测染色体单亲二体的方法,其特征在于,包括如下步骤:
S1、序列比对,家系CNV-seq的三个原始数据文件通过比对后得到三个有比对信息的文件;
S2、序列过滤;
S3、选择人群高频杂合的SNP位点数据集;
S4、获取cdSNP位点列表;
S5、统计母子、父子的样本间总体CR值和各染色体的CR值;
S6、根据CR值进行胎儿的染色体UPD分析,得出结论。
2.根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S1中序列比对,是利用高通量测序数据进行NIPT,CNV-seq等低深度测序检测项目的基础,包括选择BWA比对软件(bwa-0.7.17)将高通量测序获得原始序列数据(FASTQ文件)与人类基因组参考序列(比如GRCh37/hg19版本)进行序列比对,获得比对后的sam文件的过程。
3.根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S2中序列过滤包括对比对后的sam文件进行过滤,去除无比对(ummaped)、低比对质量(MAPQ40)和多重复比对等对可能产生错误碱基识别的序列,获得有效测序数的sam文件的过程。
4. 根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S3中选择人群高频杂合的SNP位点数据集,包括下载数据库ftp://ftp.ncbi.nih.gov/snp中人的SNP数据文件(版本151),选择SNP的基因型只有两类并且最小等位基因频率(Minor Allele Frequency,MAF)不低于0.3的位点,作为人群高频杂合的SNP位点数据集的过程。
5. 根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S4中获取cdSNP位点列表,包括分析每个比对过滤后的sam文件,找到比对结果中命中人群高频杂合的SNP位点数据集的碱基,然后对每两个文件取得均存在一条序列覆盖的SNP位点碱基信息(co-detected SNPs,cdSNPs)的过程。
6. 根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S5统计母子、父子的样本间总体CR值和各染色体的CR值,包括计算位点碱基信息(co-detected SNPs,cdSNPs)一致性值(concordance rate,CR)的过程。
7.根据权利要求1所述的基于家系的低深度测序检测染色体单亲二体的方法,其特征在于:所述步骤S6母子、父子的样本间总体CR值和各染色体的CR值,得出如下分类判定:
1)父本、母本与胎儿比对的cdSNPs的CR值应满足应亲子关系的范围,即CR0.659且CR0.737,否则亲子关系不能得到确认,不能进行UPD分析;
2)当各个染色体的CR0.659且CR0.737时,判定胎儿不存在UPD;
3)当某个染色体的胎儿与一方亲本CR0.75并且与另一个亲本小于0.636时,判定胎儿该染色体为UPD,当CR0.75的为母本时,该UPD为matUPD,相反为父本时该UPD为patUPD;
4)CR值不属于以上的情况为样本可能存在嵌合或污染。
8.根据权利要求1至7任意一项所述的基于家系的低深度测序检测染色体单亲二体的方法的制备方法,其特征在于:是通过利用胎儿与父母的样本之间各染色体均大量存在cdSNPs的特点得出的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东博奥医学检验所有限公司,未经广东博奥医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110726077.7/1.html,转载请声明来源钻瓜专利网。