[发明专利]一种基于高通量测序的微生物群落组成的方法和装置在审
申请号: | 201610195772.4 | 申请日: | 2016-03-31 |
公开(公告)号: | CN107292123A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 朱永亮 | 申请(专利权)人: | 苏州普瑞森基因科技有限公司 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215123 江苏省苏州市吴中区星*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通量 微生物 群落 组成 方法 装置 | ||
技术领域
本发明涉及生物信息学分析技术领域,尤其涉及一种微生物基因组16SrRNA高可变区V6区域的分类方法和装置。
背景技术
为了微生物群体的种类及丰度的传统方法包括:直接对微生物进行培养,变性梯度凝胶电泳、末端限制性内切酶片段长度多态性、焚光原位杂交、对可能的微生物种类进行PCR(聚合酶链式反应);但这些方式都只能揭露环境中很小一部分微生物种类。如果能进行宏基因组的分析,通过直接对环境中的微生物群体进行基因组研究,得到一个比较全面的微生物种类目录,将有助于对微生物群体的后续研究和应用。
原核生物中16S rRNA(核蛋白核糖核酸,ribosomal RNA)的序列一方面在整体上高度保守,同时含有种间差异的高变异区(V1-V7),因此该基因医疗可精确指示细菌之间的亲缘关系及其进化关系,易操作,适用于各级分类单元;所以在微生物基因组的研究中,16SrRNA测序是最常用的聚类和分类方法。但传统的基因测序是通过Sanger技术测定16S rRNA基因序列,这个技术一般得到至少500bp的读长,能帮助我们去精准地研究每一条序列的物种来源,但它容易产生嵌合体,而且测序成本比较高,费时又费力。
随着新开发出的测序技术以及测序成本的逐步降低,基因组的研究变得越来越实用,所涉及的技术包括Pyrosequencing、Solexa等。对于这些革命性的技术的一个主要挑战就是读长太短,无法对每个个体的16S rRNA进行测序,因而它的测序信息不足以让我们去精准地对微生物进行分类。但测定16S rRNA的变异区可用来来对微生物进行分类,通过设计特定的通用引物对16S可变区进行特定的PCR(聚合酶链式反应,Polymerase Chain Reaction),然后用测序仪测序,建立在这种方法上的系统树显示了很好的生物多样性,但它的测序成本高,虽然是传统毛细管测序法费用的1/10,但却是其他新一代测序仪测序费用的10倍左右。
综上所述,提供一种更加准确地对微生物进行聚类分析的方法且方便快捷、成本低廉成为本领域亟待解决的技术问题。
发明内容
本发明要解决的一个技术问题是提供一种基于16S rRNA基因高可变区V6的微生物分类方法和装置,通过对16SrRNA的高可变区V6区进行Solexa测序,并通过对这些16S rRNA可变区的短序列进行系统分类,可以在成本低廉的基础上准确反映物种的丰度信息。
本发明的第一方面提供了一种基于16S rRNA基因高可变区V6的分类方法,该方法包括:提取微生物样品中的脱氧核糖核酸(DNA);对提取DNA的宏基因组16S rRNA核糖体核糖核酸(rRNA)的高可变区(V6)进行扩增,得到作为扩增产物的DNA片段;对DNA片段进行PCR-Free Solexa建库,建库过程中在DNA片段上加上标签序列以对每个样品进行标记;将各个样品的带有标签序列的DNA片段进行混合,使用Solexa测序工具对混合后的 DNA片段进行测序,得到按照标签区分的测序读长;利用读长的重叠关系组装得到高可变区V6的全长序列;对全长序列进行分类分析,以实现对微生物群体的分类。
优选地,该方法还包括:在步骤“提取微生物样品中的脱氧核糖核酸DNA”之前,执行微生物群体的取样。
优选地,所述对全长序列进行分类分析包括:计算全长序列序列差异度;根据序列差异度执行操作分类学单元OTU的分类,将全长序列(Unique reads)分配到OTU中;将每一个OTU分类中的全长序列比对到16S rRNA的V6数据库中,将比对结果根据众数原则对OTU进行物种注释。
优选地,根据序列差异度执行操作分类学单元(OTU)的分类是指根据本领域公知的OTU分类中“种”水平之间的差异度将全长序列分配到相应的OTU中。在本发明的一个实施方案中,将序列差异度在3%以内的全长序列(unique reads)分配到一个OTU中。
优选地,将比对结果根据众数原则对OTU进行物种注释是指如果一个OTU中66%以上的比对结果均为同一个物种,则将该OTU注释为该物种;如果未达到该比例,则将物种分类信息上移一个水平(例如从“种”上移到“属”,或从“属”继续上移到“科”)再进行统计,直到达到66%的比例标准为止。
优选地,该方法还包括:在步骤“对全长序列进行分类分析”之后,基于分类分析结果,进行种群多样性分析和/或统计得到微生物群体的相对丰度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州普瑞森基因科技有限公司,未经苏州普瑞森基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610195772.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用