[发明专利]一种基于Bionano平台检测长串联重复序列的方法有效
申请号: | 201810191588.1 | 申请日: | 2018-03-08 |
公开(公告)号: | CN108460248B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 李丕栋;周家蓬;王凯;孙贝贝;汪德鹏 | 申请(专利权)人: | 北京希望组生物科技有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/30 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 陆惠中;王永伟 |
地址: | 102206 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bionano 平台 检测 串联 重复 序列 方法 | ||
本发明提供一种基于Bionano平台检测长串联重复序列的方法。本发明的方法通过构建朴素贝叶斯分类器机器学习模型,对Bionano数据进行过滤,去除插入、缺失位点的假阳性错误,并基于比对算法实现长串联重复单元计数,减少运行时间、计算资源的消耗。所述方法还可以结合聚类分析算法和每条reads上的重复单元数目,确定样本基因型为纯合、杂合或者嵌合体。
技术领域
本发明涉及基因测序技术领域,特别涉及一种基于Bionano平台检测长串联重复序列的方法。
背景技术
长串联重复序列是指DNA序列中的多个核苷酸(单个重复单元大于1kb)前后首尾相连而构成的重复序列,重复单元数目的变化会对基因组结构造成重要影响。
Bionano光学图谱是单个DNA分子有序的全基因组限制性内切酶酶切位点图谱。利用内切酶对DNA进行识别、酶切并标记荧光,再通过纳米级毛细管电泳来把DNA分子拉直,将每个DNA分子线性展开,进行超长单分子高分辨率荧光成像,生成酶切位点分布图。利用这些极长读长片段进行基因组比对克服了传统的使用小于重复单位的读长片段处理基因组重复区域的不可靠性。
Saphyr是Bionano第二代单分子基因组结构分析平台。对检测和分析基因组结构变异具有异常的敏感性和特异性,能够揭示很多基因组真实结构。Saphyr将高速、高通量以及对结构变异出色敏感性相结合,使之成为人类和转化研究应用的理想解决方案。在许多领域皆可使用高分辨率的物理基因组图谱了解基因组结构,包括未确诊的遗传性疾病诊断、基因发现与治疗进展、癌症、细胞系的研究、选择育种、进化生物学、参考基因组组装。Saphyr融合了专有的纳米通道和光学基因组图谱,使极长高分子量的DNA在其原始状态下成像。这一技术对结构变化异常敏感,基因组组装接近于单独使用短读序列测序的100倍,并准确地纠正了基于序列的组装错误。解决由下一代测序系统(NGS)遗漏的大片段结构变异,大片段结构变异与多种疾病和病症的联系密不可分。
现有检测长串联重复序列的方法是基于Bionano光学图谱技术的组装算法(参考https://bionanogenomics.com/wp-content/uploads/2014/10/Bionano-Poster-ASHG2014-Chan-Long-R epeats-CNV.pdf),将reads*(读长)组装成Contig,再比对到参考基因组序列,对串联重复序列进行肉眼计数。
基于组装算法检测长串联重复序列有以下几点缺陷:1、Bionano数据中存在大量插入、缺失错误,易导致组装错误;2、计算时间长;3、消耗大量计算资源;4、不能准确检出嵌合体样本。
发明内容
为了解决现有技术中存在的问题,本发明提供一种基于Bionano平台检测长串联重复序列的方法。本发明的方法通过构建机器学习模型,对Bionano数据进行过滤,去除插入、缺失位点的假阳性错误,并且基于比对算法实现长串联重复单元计数,减少运行时间、计算资源的消耗。所述方法还可以用于确定样本的基因类型,结合聚类分析算法和每条reads上的重复单元数目,确定样本基因型(纯合、杂合)或者嵌合体。
本发明提供的一种基于Bionano平台检测长串联重复序列的方法,包括如下步骤:
(1)提取样本DNA,采用内切酶对DNA进行酶切、标记、修复、染色,用BionanoSaphyr系统定量处理;
(2)构建基于内切酶酶切位点的Bionano参考基因组;
(3)对原始数据进行信噪比过滤;
(4)将过滤后的数据比对到步骤(2)的参考基因组;
(5)对比对后的数据进行质量评估,如果质量不合格,则终止分析,如果质量合格,则进行步骤(6);
(6)构建朴素贝叶斯分类器机器学习模型,利用朴素贝叶斯分类器对样本中指定区域的reads假阳性位点进行过滤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京希望组生物科技有限公司,未经北京希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810191588.1/2.html,转载请声明来源钻瓜专利网。