[发明专利]基于三代捕获测序对二倍体基因组单倍体分型的方法和装置有效
申请号: | 201780090335.9 | 申请日: | 2017-06-20 |
公开(公告)号: | CN110621785B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 周泽;孙宇辉;张涛;章元伟 | 申请(专利权)人: | 深圳华大生命科学研究院 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;C12Q1/6881;C12Q1/6827 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 彭愿洁;彭家恩 |
地址: | 518083 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 捕获 二倍体 基因组 单倍体 方法 装置 | ||
一种基于三代捕获测序对二倍体基因组单倍体分型的方法和装置,该方法包括:将目标基因区域对应的CCS序列比对到参考基因组得到最优比对测序片段,然后选取杂合SNP标记;选取测序深度高于预设值的区域,在该区域中寻找杂合SNP标记数目最多的窗口;对覆盖在窗口上的测序片段进行聚类,并产生两组最优SNP集合作为种子;对种子进行延伸得到一测序片段集合;找到测序片段集合对应的杂合SNP标记集合,依据各SNP的质量值得到最优单倍型对应的SNP集合;对每一测序片段打分,并依据得分将每一测序片段进行区分单倍型的判断。本发明能够对测序结果正常,覆盖度均匀的区域所包含的测序片段进行高准确度的聚类,以区分两条单倍型对应的测序片段,实现单倍体分型的目的。
技术领域
本发明涉及生物信息学技术领域,具体涉及一种基于三代捕获测序对二倍体基因组单倍体分型的方法和装置。
背景技术
自太平洋生物科技公司(Pacific Biosciences)于2011年发布第一台商业化“第三代”测序仪PacBio RS后,又相继发布了PacBio RS II以及PacBio Sequel System。“第三代”测序领域在近些年得到了快速发展。基于单分子实时(SMRT)测序技术的“第三代”测序有着全新的技术特征。相比于第二代测序“边合成边测序”的信号放大策略,SMRT测序进行实时测序,测序过程中不需要进行PCR扩增,进而避免了PCR过程带来的碱基偏向性;与此同时,SMRT测序利用零模波导孔(ZMW),产生极长的测序片段(reads),例如PacBio RS测序得到的测序片段中位数可达2,246bp,最大值可达23,000bp,较之“第二代”测序中最为广泛使用的Illumina测序仪所产生的100bp测序片段而言,是一个极大的提升。并且PacBio的测序仪已经可以用于全基因组测序(Whole Genome Sequencing)、目标区域测序(TargetedSequencing)、复杂群体分析(Complex Populations)、RNA测序(RNASequencing)和表观遗传测序(Epigenetics)。技术细节可以参见文章(Eid,John,et al.″Real-time DNAsequencing from single polymerase molecules.″Science 323.5910(2009):133-138.)。
在PacBio测序技术为动植物基因组、微生物基因组研究带来更准确、更全面、更高精度分析可能性的同时,这一测序手段仍然包含诸多技术缺陷和不成熟的部分,例如测序过程中伴随极高的错误率还会产生数量上不可忽视的短插入删除缺失(indels),随之而来的是在下游的信息分析中面临较为严峻的挑战。例如,存在部分HLA区域测序深度过高,但另外的目标区域覆盖度不良的情况。一方面冗余下机数据达到约80G,另一方面利用现有的软件进行初步组装的效果不佳,组装出的重叠群(contig)较短(N50=约5kbp),并且单倍体分型(genotype phasing)的可靠性较差,尤其表现在HLA-A基因中,利用SAMtools软件进行分型的结果有明显偏差和错误,利用SAMtools对HLA-A基因附近的CCS环形矫正测序片段分型得到的两个单倍体(haplotypes)的分布显示单倍体分型(haplotypes phasing)得到的测序片段在染色体上分布非常不均衡,部分区域深度极低,另一些区域深度极高,并且在SNP的条形图中可以看到,每个条带都有多种颜色混杂,表明分型结果混乱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780090335.9/2.html,转载请声明来源钻瓜专利网。