[发明专利]染色体水平基因组的组装方法和组装装置有效
申请号: | 202111649960.7 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114464260B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 赵勇;周勋;康玲;陶琳娜;王静 | 申请(专利权)人: | 上海诺禾致源医学检验实验室有限公司 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B30/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 染色体 水平 基因组 组装 方法 装置 | ||
本发明提供了一种染色体水平基因组的组装方法和组装装置。该组装方法包括:获取同一物种已知的染色体水平基因组作为参考基因组;将待组装个体的重叠群或支架通过与参考基因组比对,得到对应的坐标信息;根据坐标信息将待组装个体的重叠群或支架挂载到染色体水平,得到待组装个体的染色体水平的基因组。对于难以提供Hi‑C数据的物种,通过使用同一物种已发表的染色体水平基因组作为参考基因组,将新测个体的重叠群或支支架水平基因组比对到参考基因组,从而实现将新测个体有参挂载到染色体水平的目的。
技术领域
本发明涉及基因组组装领域,具体而言,涉及一种染色体水平基因组的组装方法和组装装置。
背景技术
基因组组装一般分为二代测序数据组装和三代测序数据组装,二代测序数据常用的组装软件为soapdenovo,通过小片段及大片段数据结合,组装结果为支架(scaffold)水平基因组;三代测序数据常用的组装软件为canu或者falcon,组装的结果为重叠群(contig)水平基因组。上述两种测序组装方法,都无法将基因组组装到染色体水平。
Hi-C(High-through chromosome conformation capture)技术为高通量染色体构象捕获技术,利用染色体内部互做强度远大于染色体间互做强度的原理,对组织进行甲醛交联固定,特异性的限制酶对基因组进行酶切,然后经过加生物素标记和末端修复,再次进行酶连,打断,使用磁珠捕获带生物素标记的片段进行高通量测序,测序的数据结合contig或者scaffold水平的基因组使用3d-dna软件进行挂载,最终得到染色体水平基因组。
在生产过程中,有些基因组测序往往因为成本限制,不会进行Hi-C技术测序;有些物种则因为基因组序列特异性,酶切位点重复序列较高,导致Hi-C数据有效率不能达标;还有些物种因为个体较小或者珍稀程度较高,测序样本的组织量不足以进行Hi-C技术测序。这些物种的基因组不会挂载到染色体水平,使得物种基因组的研究存在难题。
综上可知,基因组二代测序数据或者三代测序数据组装后得到重叠群(contig)或者支架(scaffold)水平的基因组后,一般通过Hi-C技术挂载到染色体水平,对于有些物种,因为采样比较困难,没有足够都样本用于Hi-C测序;或者因为物种的特异性,Hi-C技术不适用于此物种,后续染色体水平基因组的挂载会比较困难。
因此,对于没有Hi-C测序数据的物种,则难以实现染色体水平的基因组组装。
发明内容
本发明的主要目的在于提供一种染色体水平基因组的组装方法和组装装置,以解决现有技术中没有Hi-C测序数据的物种,则难以实现染色体水平的基因组组装的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种染色体水平基因组的组装方法,该组装方法包括:获取同一物种已知的染色体水平基因组作为参考基因组;将待组装个体的重叠群或支架通过与参考基因组比对,得到对应的坐标信息;根据坐标信息将待组装个体的重叠群或支架挂载到染色体水平,得到待组装个体的染色体水平的基因组。
进一步地,将待组装个体的重叠群或支架通过与参考基因组比对,得到对应的坐标信息包括:将待组装个体的重叠群或支架比对到参考基因组,得到比对文件;过滤比对文件中短于长度阈值的比对序列,得到过滤后的比对文件;将过滤后的比对文件转化为比对后的坐标矩阵文件;根据重叠群或支架比对在参考基因组上的结束位置是否大于起始位置,对坐标矩阵文件中的各序列在基因组上的方向信息进行修正,得到修正后的坐标文件;对修正后的坐标文件进行去重处理,得到唯一的对应关系坐标文件,即对应的坐标信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海诺禾致源医学检验实验室有限公司,未经上海诺禾致源医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649960.7/2.html,转载请声明来源钻瓜专利网。