[发明专利]一种基因组测序组装结果修复的方法、装置和存储介质有效
申请号: | 201810219052.6 | 申请日: | 2018-03-16 |
公开(公告)号: | CN110310702B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 贺丽娟;刘亚斌;杨林峰;邓天全;陈露;高强 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B30/10 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 李小焦;彭家恩 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因组 组装 结果 修复 方法 装置 存储 介质 | ||
本申请公开了一种基因组测序组装结果修复的方法、装置和存储介质。本申请的方法包括,将待验证基因组组装结果与Bionano分子图谱比对,找出两者分子标记不匹配或长度不一致的区域,在该区域的基因组序列上下游各延伸预设长度,作为异常区域;分别分析二代数据和三代数据对异常区域的覆盖度;根据覆盖度对异常区域进行修复,获得修复的基因组组装结果。本申请方法,采用二代测序技术、三代测序技术和Bionano图谱联合修复基因组组装结果,解决了基因组拼接中由区域复杂性引入的结构性错误,可防止传统Bionano验证对结构冲突区域操作处理上对组装结果的过多丢失,也可处理和验证Bionano与基因组组装结果分子标记长度不一致区域,提高了基因组拼接准确性和完整性。
技术领域
本申请涉及核酸测序领域,特别是涉及一种基因组测序组装结果修复的方法、装置和存储介质。
背景技术
目前,基于全基因组鸟枪法(WGS)的Illumina测序平台得到的二代测序数据具有测序通量高,速度快,精确度高,成本低,并且可以测量不同插入片段大小的DNA片段文库,尤其可以测量DNA大片段文库序列的特点,例如可以测量插入片段长度大于1k的文库,在过去的几年时间内广泛应用在基因组组装分析中。
但是二代测序方法由于测序片段短,采用双末端测序方法,对于基因组内部具有很高复杂度的区域,测序数据很难正确处理。随后拥有超长读长的第三代单分子实时测序技术(SMRT)的Pacbio数据也飞速发展起来;同时,拥有超高精度和超长序列的新一代图谱方法BioNano Genomics’ System测序得到的分子图谱,简称Bionano分子图谱,也越来越多的应用于基因组组装的辅助分析中。
随着技术的发展,现在基因组组装的主要技术是用三代Pacbio数据搭建基因组骨架,然后用三代Pacbio数据和二代数据对基因组组装结果进行纠错,然后用Bionano分子图谱进行scaffold连接,得到最终的组装结果。Pacbio数据有高的测序错误,二代数据精确性高,但是序列长度偏短。所以二代Illumina数据及三代Pacbio数据结合使用得到较为完整的基因组骨架,同时用Bionano分子图谱将基因组结果连成更为完整的基因组组装结果,这种方法已经被逐渐应用于组装案例中。
但是,在实际利用超长读长的Bionano分子图谱对基因组组装结果进行结构验证时,发现存在很多结构异常区域,对于这些结构异常区域的处理方法包括:
(1)用Bionano分子图谱直接对组装结果进行连接,对于有冲突的区域直接在分子标记处打断,由于Bionano分子图谱的分子标记之间的距离很大,这样会导致一些实际上正常的序列也被截断,进而导致本来正确的组装序列的丢失。
(2)传统的Bionano分子图谱的直接处理方法,对于分子标记结构匹配但长度不一致的区域,都当作结构变异(缩写SV)处理,在组装结果中不做修正,但是在实际中,这样的序列也可能是组装序列不完整导致。
发明内容
本申请的目的是提供一种新的基因组测序组装结果修复的方法、装置和存储介质。
本申请的第一方面公开了一种基因组测序组装结果修复的方法,包括将待验证的基因组组装结果与Bionano分子图谱进行比对,找出两者的分子标记不匹配或者对应长度不一致的区域,在不匹配或者对应长度不一致的区域的基因组序列的上下游各延伸预设长度,作为异常区域;分别分析第二代测序数据和第三代测序数据对异常区域的覆盖度;根据第二代测序数据和第三代测序数据对异常区域的覆盖度,对异常区域进行修复,获得修复的基因组组装结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810219052.6/2.html,转载请声明来源钻瓜专利网。