[发明专利]基于系统进化树的泛基因组构建方法和构建装置在审
申请号: | 202010260748.0 | 申请日: | 2020-04-03 |
公开(公告)号: | CN111477281A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 张锦波;鲍冠辉;李季 | 申请(专利权)人: | 北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司 |
主分类号: | G16B40/30 | 分类号: | G16B40/30;G16B30/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 系统 进化 基因组 构建 方法 装置 | ||
1.一种基于系统进化树的泛基因组构建方法,其特征在于,所述构建方法包括:
对不同株系的菌株进行系统进化树构建,得到系统进化树;
根据不同株系的所述菌株在所述系统进化树上的不同位置,按照从底层到顶层的方向两两聚类,逐层进行泛基因组构建,得到不同株系总的泛基因组。
2.根据权利要求1所述的构建方法,其特征在于,在对不同株系的菌株进行系统进化树构建之前,所述构建方法还包括:
获取不同株系的所述菌株的基因组序列信息和注释信息;
根据各所述菌株的基因组序列信息和注释信息,选择所有株系中的保守蛋白序列进行多序列比对,得到比对结果;
根据所述比对结果进行所述系统进化树的构建;
优选地,采用muscle软件对所有株系中的保守蛋白序列进行所述多序列比对,得到初比对结果;
采用Gblocks软件对所述初比对结果进行过滤,得到所述比对结果;
优选地,采用Protest软件,根据所述比对结果进行所述系统进化树构建;
优选地,所述不同株系的菌株为病毒、细菌、真菌、寄生虫、螺旋体、支原体、衣原体及立克次体,或者为遗传多态性为2%~30%,优选为5~25%,更优选为10~20%的动物或植物。
3.根据权利要求2所述的构建方法,其特征在于,获取不同株系的所述菌株的基因组序列信息和注释信息的方式包括如下至少之一:
(1)从已知的基因组序列信息和注释信息获取;
(2)通过对所述菌株依次进行测序、组装和注释得到。
4.根据权利要求3所述的构建方法,其特征在于,通过对所述菌株进行测序、组装和注释,获取所述菌株的基因组序列信息和注释信息包括:
对待比较的所述菌株进行测序,得到测序reads;
基于所述测序reads的重叠性对所述菌株进行序列拼接组装,得到基因组序列;
对所述基因组序列进行重复序列和基因结构注释,得到所述菌株的基因组注释结果;
优选地,对所述菌株进行PacBio测序或纳米孔测序;
优选地,采用Falcon、Canu或者WTDBG软件,基于所述测序reads的重叠性对所述菌株进行序列拼接组装;
优选地,采用RepeatMasker、August、GlimmerHMM、GeneWise或者EVM软件对所述基因组序列进行重复序列和基因结构注释。
5.根据权利要求1至4中任一种所述的构建方法,其特征在于,根据不同株系的所述菌株在所述系统进化树上的不同位置,按照从底层到顶层的方向两两聚类,逐层进行泛基因组构建,得到不同株系总的泛基因组包括:
根据不同株系的所述菌株在所述系统进化树上的不同位置,先对所述底层的所述菌株两两进行比对,并以序列相似度阈值划分核心基因组和非核心基因组,得到底层的泛基因组;
将所述底层的泛基因组与所述底层的上一层的基因组或泛基因组再次进行泛基因组构建,依次类推直至顶层,从而得到不同株系的总的泛基因组;
优选地,所述序列相似度阈值为90%,大于等于90%的划分为核心基因组,低于90%的为非核心基因组。
6.根据权利要求1所述的构建方法,其特征在于,在得到不同株系的总的泛基因组后,所述构建方法还包括:
对每个进化节点和所述总的泛基因组相关的区域做序列长度和基因个数进行统计,从而获得每个所述菌株在每个所述进化节点上的存在/缺失变异情况。
7.一种基于系统进化树的泛基因组构建装置,其特征在于,所述构建装置包括:
进化树构建模块,用于对不同株系的菌株进行系统进化树构建,得到系统进化树;
泛基因组构建模块,用于根据不同株系的所述菌株在所述系统进化树上的不同位置,按照从底层到顶层的方向两两聚类,逐层进行泛基因组构建,得到不同株系的总的泛基因组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司,未经北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010260748.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:直线电机的动子位置检测装置及设备
- 下一篇:一种高灵活度报表方法及系统