[发明专利]一种二代序列和三代单分子实时测序序列联合补洞方法和系统有效

专利信息
申请号: 201610741836.6 申请日: 2016-08-26
公开(公告)号: CN107784201B 公开(公告)日: 2021-05-28
发明(设计)人: 邓天全;贺丽娟;杨林峰 申请(专利权)人: 深圳华大基因科技服务有限公司
主分类号: G16B20/30 分类号: G16B20/30;G16B30/00
代理公司: 深圳鼎合诚知识产权代理有限公司 44281 代理人: 孙银行;彭家恩
地址: 518083 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 二代 序列 三代单 分子 实时 联合 方法 系统
【说明书】:

发明公开了一种二代序列和三代单分子实时测序序列联合补洞方法和系统,该方法包括:基因组参考序列建库;将三代单分子实时测序序列比对到基因组参考序列;获得间隙序列支持;提取间隙序列支持;组装,建立一致的间隙填充序列;使用一致的间隙填充序列修补基因组参考序列的间隙;使用二代序列和修补后的基因组参考序列进行比对获得无效比对区域,并用无效序列对该区域进行替换,获得新基因组参考序列;用二代序列对新基因组参考序列进行补洞,获得最终基因组参考序列。本发明的方法采用二代序列与三代单分子实时测序序列相结合的方法进行分级补洞,提高了基因组完整性和准确性。

技术领域

本发明涉及核苷酸序列组装技术领域,尤其涉及一种二代序列和三代单分子实时测序序列联合补洞方法和系统。

背景技术

目前,基因组组装项目以全基因组鸟枪法测序(Whole-genome shotgunsequencing,WGS)为主流设计方案,它主要根据基因组的重复序列的具体特点,搭配不同长度的DNA插入片段进行双末端测序,在全基因组的平均测序深度足够的情况下可保证单碱基的准确性和基因组的完整性。随着第二代测序技术(Next-generation sequencing,NGS)的成熟和普及,测序成本大大降低,基于第二代测序技术的全基因组鸟枪法测序成为各种基因组项目测序的主流方案。

然而对于复杂基因组,其具有高杂合性(杂合性即在同源染色体上的一个或多个位点上有不同等位基因存在的状态)与重复序列等各种问题,上述的解决方案易受这些问题的干扰,组装结果无法达标,导致数据分析及组装困难,不适用于复杂基因组。同时由于重复序列比较长,二代短序列无法跨越此区域,用二代序列补洞效果不是很理想。

将组装出的重叠群或骨架序列从大到小排列,当其累计长度刚刚超过全部组装序列总长度50%时,最后一个重叠群(Contig)或骨架序列(Scaffold)的大小即为N50的大小,N50对评价基因测序的完整性有重要意义。

目前三代——Pacbio单分子实时测序(SMRT)技术由于具有超长读长的特点,能对高重复序列、转座子区域及高度变异区域等基因组复杂区域进行高水平组装或补洞,使得Contig N50和Scaffold N50长度更长,组装和补洞结果更完整准确,三代测序技术用于全基因组组装和补洞的物种越来越多。但其由于样品要求高、成本昂贵、单碱基错误率高(比如Pacbio RSII平台序列平均15%的错误率),如果只用Pacbio单分子实时测序序列进行全基因组装或补洞,组装和补洞后的某些区域可能会存在碱基错误,影响组装和补洞结果的准确性。

发明内容

本发明提供一种二代序列和三代单分子实时测序序列联合补洞方法和系统,能够提高基因组组装结果的指标和准确性。

根据本发明的第一方面,本发明提供一种二代序列和三代单分子实时测序序列联合补洞方法,包括:进行基因组参考序列建库;将三代单分子实时测序序列比对到上述基因组参考序列;获得间隙序列支持,确定支持每个间隙的三代单分子实时测序序列;提取间隙序列支持,获取所有支持每个间隙的三代单分子实时测序序列并放到同一个文件夹中;对上述同一个文件夹中的序列进行组装,建立一致的间隙填充序列;使用上述一致的间隙填充序列修补上述基因组参考序列的间隙并输出修补结果;使用二代序列和经过上述三代单分子实时测序序列修补后的基因组参考序列进行比对获得无效比对区域,并用无效序列对该区域进行替换,获得新基因组参考序列;用二代序列对上述新基因组参考序列进行补洞,获得最终基因组参考序列。

进一步地,上述进行基因组参考序列建库包括:对上述基因组参考序列的每条骨架序列命名、建索引、及统计间隙信息。

进一步地,上述方法还包括:上述三代单分子实时测序序列利用序列间的比对关系进行自纠错,得到自纠错后的三代单分子实时测序序列。

进一步地,上述方法还包括:上述三代单分子实时测序序列在自纠错之前先过滤接头、短序列和低质量值序列以获得过滤后的序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610741836.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top