[发明专利]对宿主样本进行微生物分析的方法和装置有效
申请号: | 201811169458.4 | 申请日: | 2018-10-08 |
公开(公告)号: | CN111009286B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 袁剑颖;王子榕;陈晴;孙瑞雪;周加利;吴红龙 | 申请(专利权)人: | 深圳华大因源医药科技有限公司;华大生物科技(武汉)有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 赵天月 |
地址: | 518057 广东省深圳市南山区粤海街道高新区社区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宿主 样本 进行 微生物 分析 方法 装置 | ||
1.一种对宿主样本进行微生物分析的方法,所述方法用于非疾病诊断目的,其特征在于,包括:
(1)采用宿主基因组数据库,对来自于所述宿主样本的测序数据集合进行第一过滤处理,以便从所述测序数据集合中去除能够与所述宿主基因组数据库比对上的测序数据,所述测序数据集合来自于对所述宿主样本进行宏基因组测序;
(2)采用同源数据库,对所述测序数据集合进行第二过滤处理,所述同源数据库包括已知的质粒序列、耐药性序列、细菌毒力序列的至少一部分,以便从所述测序数据集合中去除能够与所述同源数据库比对上的所述测序数据;
(3)将经过所述第一过滤处理和所述第二过滤处理的所述测序数据集合与微生物基因组数据库进行比对,以便确定所述测序数据集合中来自于所述微生物的微生物测序数据;
所述微生物基因组数据库是通过下列步骤构建的:
(a)获取已知的微生物基因组序列,构建初步微生物基因组数据库,所述初步微生物基因组数据库中的微生物基因组序列包括全基因组序列信息、染色体序列信息、Scaffold序列信息、Contig序列信息的至少一部分;
(b)对所述初步微生物基因组数据库中的序列进行冗余去除,以便获得去冗余微生物基因组数据库,所述冗余去除指的是去除相似性在99%以上的序列;
(c)基于所述去冗余微生物基因组数据库中,针对存在多株基因组序列的物种,选择代表性菌株的所述微生物基因组序列,并从所述去冗余微生物基因组数据库中去除所述物种的其他菌株的所述微生物基因组序列,以便获得所述微生物基因组数据库;
通过下列方法获得所述代表性菌株:
针对存在多株基因组序列的物种,确定每两个菌株的基因组序列之间的平均一致性;
基于所述每两个菌株的基因组序列之间的平均一致性,得到所述物种内多株基因组序列之间的相似性矩阵;
基于所述相似性矩阵,选择与其他各菌株序列平均相似性最大的菌株作为代表性菌株;
其中,在步骤(3)中进一步包括利用高频比对位点数据库对所述微生物测序数据进行第三过滤处理,以便去除比对到高频比对位点的测序数据,其中,所述高频比对位点数据库是通过下列步骤构建的:
将多个样本的宏基因组测序数据与所述微生物基因组数据库进行比对,其中所述微生物基因组被预先划分为多个预定的窗口,以便确定匹配所述窗口的所述宏基因组测序数据数目;
基于匹配所述窗口的所述宏基因组测序数据数目,确定构成所述高频比对位点数据库的多个高频比对位点。
2.根据权利要求1所述的方法,其特征在于,所述宿主基因组数据库为人类基因组数据库。
3.根据权利要求2所述的方法,其特征在于,所述人类基因组数据库包括人类参考基因组序列和炎黄基因组序列。
4.根据权利要求1所述的方法,其特征在于,所述多个样本与所述宿主样本属于相同的物种。
5.根据权利要求1所述的方法,其特征在于,将比对频率大于5%的比对位点作为所述高频比对位点,所述比对频率为比对到比对位点的样本的数量占总样本数量的比值。
6.根据权利要求1所述的方法,其特征在于,步骤(3)在将经过所述第一过滤处理和所述第二过滤处理的所述测序数据集合与所述微生物基因组数据库进行比对时,进一步基于下列中的至少之一确定所述测序数据集合中来自于所述微生物的微生物测序数据:
保留所述测序数据集合中比对长度占比大于90%的序列;
保留所述测序数据集合中错配碱基数小于5%的序列;
保留比对特异性的序列,所述比对特异性的序列指的是统计序列比对到不同位置的比对分数,选择次优比对分数与最优比对分数的比值小于0.8的序列作为比对特异性的序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大因源医药科技有限公司;华大生物科技(武汉)有限公司,未经深圳华大因源医药科技有限公司;华大生物科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811169458.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:晶片封装体
- 下一篇:用于区块链系统的方法、装置和计算机存储介质