[发明专利]一种获得染色体水平基因组的方法有效
申请号: | 202110202878.3 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112908415B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 曲俊杰;尹玲 | 申请(专利权)人: | 广西壮族自治区农业科学院 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B20/20 |
代理公司: | 南宁市吉昌知识产权代理事务所(普通合伙) 45125 | 代理人: | 李秋琦 |
地址: | 530007 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获得 染色体 水平 基因组 方法 | ||
1.一种获得染色体水平基因组的方法,其特征在于,包括以下步骤:
(1)将第二代测序结果组装得到的基因组scaffold打断成没有gap的contig结果,使用基因组组装软件,利用通过Hi-C技术得到的测序数据,将所述contig结果挂载到染色体水平;
(2)记录步骤(1)得到的基于Hi-C数据的挂载结果中,每条染色体中各个contig的顺序;
(3)使用第二代测序数据组装软件,将步骤(1)中所述的contig结果基于大片段mate-pair文库,构建得到基因组scaffold,记录在各scaffold中各个contig的顺序;
(4)将步骤(2)和步骤(3)中记录的两套版本的contig顺序进行一致性比对,对步骤(3)的基因组scaffold中各个contig的顺序进行校正,保留与步骤(2)的结果一致的contig连接顺序,将与步骤(2)的结果不一致的contig顺序打断,得到更新后的scaffold/contig组装结果;
(5)使用基因组组装软件,利用通过Hi-C技术得到的测序数据,将步骤(4)得到的更新后的scaffold/contig组装结果再次挂载到染色体水平,记录挂载结果中每条染色体中各个contig的顺序;
(6)使用第二代测序数据组装软件,将步骤(4)得到的更新后的scaffold/contig组装结果,再次基于大片段mate-pair文库,利用开源组装软件,构建得到新的基因组scaffold,记录在各scaffold中各个contig的顺序;
(7)将步骤(5)和步骤(6)中记录的两套版本的contig顺序再次进行一致性比对,对步骤(6)的基因组scaffold中各个contig的顺序进行校正,保留与步骤(5)的结果一致的contig连接顺序,将与步骤(5)的结果不一致的contig顺序打断,再次得到更新后的scaffold/contig组装结果;
(8)利用步骤(7)中得到的更新后的scaffold/contig组装结果,重复步骤(5)~(7),直至通过Hi-C测序数据得到的基因组scaffold和通过大片段mate-pair文库得到的基因组scaffold对比不再出现新的一致的contig顺序,并保留最终通过Hi-C测序数据得到的基因组scaffold版本;
(9)将最终通过Hi-C测序数据得到的基因组scaffold版本中没有挂载到染色体水平的零散的contig,与最终通过大片段mate-pair文库得到的基因组scaffold版本进行比对,将这些有大片段mate-pair文库的scaffold支持的零散contig连接成scaffold,并替换最终通过Hi-C测序数据得到的基因组scaffold版本中对应的零散contig,得到经过校正的最终版的染色体水平的基因组组装结果。
2.按照权利要求1所述的方法,其特征在于:步骤(1)将第二代测序结果组装得到的基因组scaffold打断成没有gap的contig结果时,打断的位置为基因组scaffold中N的位置。
3.按照权利要求1所述的方法,其特征在于:步骤(1)和步骤(5)中所述的基因组组装软件为Lachesis软件。
4.按照权利要求1所述的方法,其特征在于:步骤(3)和步骤(6)中所述的第二代测序数据组装软件为sspace软件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西壮族自治区农业科学院,未经广西壮族自治区农业科学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110202878.3/1.html,转载请声明来源钻瓜专利网。