[发明专利]一种环境微生物基因组草图的构建方法有效
申请号: | 201510983092.4 | 申请日: | 2015-12-24 |
公开(公告)号: | CN105420375B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 万成;文平;陆祖宏;康玉麟 | 申请(专利权)人: | 北京大学 |
主分类号: | C12Q1/6806 | 分类号: | C12Q1/6806;G16B40/00 |
代理公司: | 11360 北京万象新悦知识产权代理有限公司 | 代理人: | 李稚婷 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 微生物 基因组 草图 构建 方法 | ||
1.一种环境微生物基因组草图的构建方法,包括以下步骤:
1)采集环境微生物样品,根据下述公式1确定单次测序平行实验所需的细胞数N及平行实验的次数X:
公式1:
其中,p=1-(1-α)N,q=(1-α)N,α为某物种在样品中的相对丰度的预估值;
2)采用多重置换扩增技术对微生物样品进行全基因组扩增测序,共进行X次平行实验,每次实验使用的细胞数为N;
3)对测序数据进行分析:首先构建微生物群落非冗余基因集,所构建的微生物群落非冗余基因集满足如下标准:(i)任意基因间不能满足聚类条件;(ii)冗余基因集中的任意基因都可以在非冗余基因集中找到同源基因来代表;然后将非冗余基因集中的基因序列与微生物基因组数据库进行比对,判定其中的已知微生物种类;最后通过contig聚类获得微生物基因组草图;其中,通过contig聚类获得微生物基因组草图的方法是:选取非冗余基因集中的特定基因,以之为节点,采用基于隐马尔科夫模型的算法将contig进行聚类,得到属于不同微生物的contig簇,满足一定标准的contig簇即为微生物基因组草图。
2.如权利要求1所述的构建方法,其特征在于,步骤2)对微生物样品进行全基因组扩增,扩增产物构建index测序文库,然后进行测序,每次测序实验的数据量不低于2Gb。
3.如权利要求1所述的构建方法,其特征在于,步骤3)中构建微生物群落非冗余基因集的方法是:首先对测序数据进行质量控制,包括:去除接头序列,过滤掉双端reads平均质量值<20的序列,截掉序列两端碱基分布波动大于30%的部分,对于来自宿主的样品过滤掉宿主序列;然后采用多kmer值并行进行无参考基因组组装,选取最佳组装结果,得到contig序列;接着对contig序列进行基因预测,得到基因序列,并通过同源比对,获得基因序列的两两间相似度;对基因序列进行聚类去冗余,得到非冗余基因集。
4.如权利要求3所述的构建方法,其特征在于,对基因序列进行聚类去冗余时的聚类条件为:基因间重叠长度大于等于90%且blast同源比对相似度大于等于95%。
5.如权利要求1所述的构建方法,其特征在于,步骤3)中,判定已知微生物种类的条件为:(a)某已知物种2×以上深度的基因组覆盖度不低于20%;(b)测序序列连续覆盖的最长片段在18~22Kb范围内;(c)该物种在X次平行实验的数据中至少有2次满足前两个条件。
6.如权利要求1所述的构建方法,其特征在于,进行contig聚类的方法是:首先,确定基因和contig的对应关系,即某个基因来源于哪条或哪几条contig;然后,选定种子基因,所述种子基因应当满足的条件为:(i)在1条以上的contig中存在;(ii)保守度大于0.8;(iii)长度大于1Kb;接着,随机选择一个种子基因进行第一轮contig聚类,将所有包含该种子基因的contig聚为一组;第一轮聚类得到的contig上包含的基因具有很高的重复数,选择重复数第二高的基因进行第二轮聚类,依次循环,直至contig聚类中所包含的基因不能在剩余的contig中找到相同的拷贝,则一次聚类结束,得到属于同一个物种的contig簇;用剩余的contig重复聚类过程,至所有contig分配完成。
7.如权利要求1所述的构建方法,其特征在于,通过下述方法判断contig聚类效果的质量:将contig簇与样品中存在的已知微生物参考基因组进行比对,通过对已知微生物基因组的覆盖度和准确率的评价,判断未知微生物基因组的contig分类效果。
8.如权利要求1所述的构建方法,其特征在于,在步骤3)之后,将所有测序序列比回聚类得到的contig簇,将比对上的测序序列进行组装,评价组装效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510983092.4/1.html,转载请声明来源钻瓜专利网。